Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov.
Хаб: @AIMolodcaHub
«Al molodca - это канал в телеге, где какой-то чувак показывает картинки, которые делает компьютер» © Bing
Информация о канале обновлена 15.08.2025.
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov.
Хаб: @AIMolodcaHub
«Al molodca - это канал в телеге, где какой-то чувак показывает картинки, которые делает компьютер» © Bing
Готово.
Ну что ж, добро пожаловать в эру контекстных видео-моделей. 😅
Runway Aleph — в каждой второй новости и будто бы вновь заставляет перегретый нейросетями мозг испытать то самое забытое чувство техномагии.
А что на деле? Для теста выбрал шедевр кинематографа, с которым вы наверняка знакомы. Промпты — одноклеточные, из серии: Make (что-то).
Первое впечатление:
1) В целом — жесть, круто.
2) Жаль, что пока только пять секунд.
3) Плохо справляется с мелкими объектами, динамичными или комплексными движениями камеры, нестандартными концептами — в общем, всё те же болячки видео-моделей.
4) Кредиты сгорают со скоростью света — берите анлим.
5) В целом — круто, жесть.
Продолжаю тестировать и жду заявленный аналог от Luma. Думаю, скоро подтянутся Kling и прочие китайские товарищи.
Вагон и тележка крутых новостей и неожиданных обновлений, но пока — про функцию, которую я лично ждал даже не год (столько прошло с анонса), а всю жизнь.
Harmonize — простая функция в старом добром Фотошопе (бета) — берет и вписывает объект в сцену. Всё. Сколько часов жизни было потрачено на ручную ретушь, ЦК и проклятые светотени — не счесть. Теперь это секунда. Как говорилось в старой рекламе какого-то кваса: «Не кайф, а услада».
Небольшая, но приятная новость — в Midjourney video завезли конечные кадры.
Видеоделы знают, насколько полезна эта функция и как её не хватает в топовых img-to-video моделях (Kling 2.1, Veo-3, Minimax Hailluo 2). Из нового поколения разве что только Luma Ray 2.1 её поддерживает. Так что — молодцы, Midjourney. А почему стоит включить их видеомодель в свой пайплайн — писал здесь.
Если последние пару недель вы копали грядки на даче, лежали на пляже и вообще прекрасно проводили время без интернета — вот коротко, что произошло интересного. 😁
1. OpenAI (первое видео), следуя очевидному тренду, выпустили Agent. Умеет создавать презентации, таблицы, ставить единицы фильмам Сарика Андреасяна — и совершать прочие рутинные действия во Всемирной сети Интернет. У меня почему-то недоступен. Кто пользовался — жду ваших впечатлений.
Ещё мелочь, но приятная — у GPT Image должен вот-вот появиться High Input Fidelity, как у Flux Kontext. Теперь, меняя что-то на картинке, она будет перерисовываться минимально. Полезно? Очень.
2. Flux Kontext. Дополнился множеством пресетов для работы с загруженной картинкой. Поменять ракурс, освещение, убрать текст, сделать себя качком — и многое другое можно здесь (бесплатно даётся 200 кредитов).
3. Runway (второе видео). Выпустили Act Two. Записываете свою невероятную актёрскую игру, загружаете изображение какого-нибудь монстра — и вот, монстр это вы. Причём анимируется всё изображение: например, если где-то на фоне есть огонь — он будет гореть (в Act One такого не было). Подписку на Runway я отменил, не тестировал, но вещь в продакшене полезная.
4. Suno (третье видео). Выпустили 4.5+. Улучшение по всем параметрам, добавлено множество крутилок для контроля. Очень нравится. Отдельная ПЕСНЯ — это каверы. Об этом — следующий пост.
5. Маск и Co. Выпустили Grok 4, а в своё приложение добавили аниме-аватаров, с которыми можно поболтать (и выключить NSFW-фильтр). По бенчмаркам — супер, но сам использовал Grok примерно один раз.
6. Higgsfield. Теперь картиночную модель Soul (натренированную на Flux) можно дообучить и генерить aEsThEtiC-кадры с собой (или своим котом). Испытывает классические флюксо-симптомы — например, шакалинг на общих планах.
7. Veo-3. Стал доступен почти везде, но если выходите из Европы — будет недоступна загрузка реалистичных людей в img-to-video. Также твиттерские нейроцыгане активно форсят JSON-промтинг. Никаких преимуществ у него не выявил — кроме структурности (для человека).
8. Ну и вишенка. Топовый инвестор OpenAI поехал кукушечкой после общения с ChatGPT. Случай далеко не первый — здесь можно почитать подробности. Мораль — если у вас, например, мания, лучше воздержаться от LLM'ок, которые легко подкинут дровишек в её пламя.
Пойду дальше разгружать вагоны с проектами.
Пишите, если что-то забыл. 🤔
Владелец канала не предоставил расширенную статистику, но Вы можете сделать ему запрос на ее получение.
Также Вы можете воспользоваться расширенным поиском и отфильтровать результаты по каналам, которые предоставили расширенную статистику.
Также Вы можете воспользоваться расширенным поиском и отфильтровать результаты по каналам, которые предоставили расширенную статистику.
Подтвердите, что вы не робот
Вы выполнили несколько запросов, и прежде чем продолжить, мы ходим убелиться в том, что они не автоматизированные.