Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Информация о канале обновлена 05.10.2025.
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Пользователи выяснили, что Sora 2 генерирует очень реалистичные видео, но при этом совершенно не может показать человека, который садится в машину.
Видеографы могут спать спокойно. Пока могут
r/#OpenAI
F9K2DM
Если вы хотели попробовать Sora 2, но не знали где взять инвайт, то вот вам код от исследователя из команды Sora, для первых 10.000 человек
Лайфхак
We surely have a timeline where this is real
Тут есть две пачки новостей, хорошая и плохая.
Хорошая:
Open Source - https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
Мазохисты могут попробовать тут: https://hunyuan.tencent.com/image/en?tabIndex=0 (чорная кнопка справа от huggingface)
Я уже пробую тут: https://fal.ai/models/fal-ai/hunyuan-image/v3/text-to-image/playground
Есть на репликейт и вейвспид.
HunyuanImage 3.0 это крупнейшая и самая мощная (если брать голые цифры параметров) на сегодняшний день модель преобразования текста в изображение с открытым исходным кодом, имеющая более 80 миллиардов параметров, из которых 13 миллиардов активируются на каждый токен во время вывода.
В отличие от традиционных моделей генерации изображений с архитектурой DiT, архитектура MoE HunyuanImage 3.0 использует подход на основе Transfusion для глубокой связи обучения Diffusion и LLM в единой системе. Построенная на Hunyuan-A13B, HunyuanImage 3.0 была обучена на огромном наборе данных: 5 миллиардах пар изображений и текстов, видеокадрах, чередующихся данных изображений и текстов и 6 триллионах токенов текстовых корпусов. Это гибридное обучение, охватывающее мультимодальное генерирование, понимание и возможности LLM, позволяет модели беспрепятственно интегрировать несколько задач.
Итого:
На борту ризонинг с использованием мирового знания
Понимание огромных промптов на тысячи слов
Убойная работа с текстами
Трушная мультимодальность
Все это я проверил на ОДНОМ примере.
Вместо промпта написал ей:
solve this:
8x + 10 = 18
and make picture with soulution
Результат вы видите в шапке поста. Впечатляет.
Черрипики на сайте
https://hunyuan.tencent.com/image/en?tabIndex=0
довольно мощные, но давайте навалимся и протестируем сами (ссылка на fal.ai).
В общем выглядит прельстивейше.
А теперь Чорные Новости:
Нет (пока) image2image
Нет (пока) VLLM
Веса весят (пардон) СТО СЕМЬДЕСЯТ ГИГОВ
Ну и самое горькое: для запуска вам понадобится ЧЕТЫРЕ карты по 80GB VRAM КАЖДАЯ (4х80GB VRAM)
Там вроде MoE c 64 экспертами юзают не все 80B параметров, а только 13B активных. Ждем оптимизаций, выгрузок, и нам также обещаны дистиллированные веса (тут мы такие - дистилят для слабаков и плохого качества)
То есть это вроде бы опен сорс, но не для людей, а для олигархов с видеосерверами на 320GB VRAM на кухне.
Предлагаю называть это элитный опен сорс.
Отзывы в твитторах противоречивые. Есть проблемы с анатомией и текстурой кожи, но надо пробовать самим.
А вообще Хунь, в отличие от Алибабы и Квена, любит бахнуть на Гитхаб сырой код, огромные веса, формальное описание типа "мы смогли, а вы держитесь"
Пока тестируем на агрегаторах.
@cgevent
Впервые за 3 года я показываю свой рабочий процесс — от гитары и вокала до финальной обработки нейросетями и в Ableton.
Никакой магии, только честный взгляд изнутри.
В этом видео:
▫️ как я записываю гитару и вокал
▫️ где и зачем использую нейросети (RVC и др.)
▫️ как свожу трек в Ableton
▫️ почему ИИ — это всего лишь инструмент, как гитара или синтезатор
Поддержать мой проект и получить эксклюзивные материалы можно на Boosty: https://boosty.to/aigitarist/posts/143c72ce-a030-4d83-8465-6ae0445c21b2?share=success_publish_link
👇 Пишите в комментариях, что думаете о таком «закулисье» и какие темы разобрать в следующих видео!
https://youtu.be/1gDZwmvP0sk
#айгитарист #нейрокавер #aicover
Red Alert Tesla Coil achieved internally
Субботний щитпост
Владелец канала не предоставил расширенную статистику, но Вы можете сделать ему запрос на ее получение.
Также Вы можете воспользоваться расширенным поиском и отфильтровать результаты по каналам, которые предоставили расширенную статистику.
Также Вы можете воспользоваться расширенным поиском и отфильтровать результаты по каналам, которые предоставили расширенную статистику.
Подтвердите, что вы не робот
Вы выполнили несколько запросов, и прежде чем продолжить, мы ходим убелиться в том, что они не автоматизированные.