эйай ньюз

Telegram t.me web k

Статистика

Вся статистика

83615

Подписчики

Посты (30 дней)

37.26%

ERR%

0.00

Средний охват (сутки)

Язык

Russian

Описание:

Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии.

Aвтор: @asanakoy

PR: @KANDER426

Телеграм канал эйай ньюз @ai_newz добавлен на наш сайт 18.06.2022
Информация о канале обновлена 20.11.2025.

Посты

Все посты

Gemini 3 Pro доступна в AI Studio

SOTA по всем бенчам кроме SWE-Bench, где отстаёт от Sonnet 4.5 на 1 процентный пункт. Модель дороже на 20% чем 2.5 Pro, как она использует токены пока непонятно. Официального блогпоста пока что нет, но пару часов назад нашли model card, оттуда и скрин с бенчами.

https://aistudio.google.com/app/prompts/new_chat?model=gemini-3-pro-preview

@ai_newz

Вышел Grok 4.1

Это апдейт посттрейна поверх той же базовой модели Grok 3 на три триллиона параметров. Модель идёт как в ризонинг, так и в инстракт варианте. При этом нельзя просто так вызвать ризонера — запрос сначала в любом случае идёт в инстракт модель, после чего появляется кнопочка "think harder", которая уже перенаправляет запрос ризонеру.

В анонсе концентрируются на лучшем эмоциональном интеллекте и creative writing, с чем у оригинального Grok 4 были проблемы. Кроме этого команде удалось заметно уменьшить количество галлюцинаций. Ну и на арене новый Grok занял первое место, но это мало что значит — вырвал первое место он у Gemini 2.5 Pro. Других бенчей xAI не опубликовали, так что вряд-ли там что-то заметно улучшилось.

Блогпост

@ai_newz

Нейродайджест за неделю (#94)

LLM

- GPT 5.1 — Большой упор на пользователей, которым не понравилась личность GPT-5. Модель стала дружелюбнее, лучше следует инструкциям, а Thinking-версия теперь эффективнее распределяет ресурсы.

Генеративные модели
- Обновление Flow — Google продолжает прокачивать Veo. Появился контроль над камерой и видео-инпейнт (Insert) в уже готовых генерациях.
- Тизер nano-banana2 — В X тизерят новую версию. По слухам, будет генерить в 4к и использовать Gemini 3.0 как текстовый энкодер.

Прочее
- SIMA 2 — Апгрейд AI-агента для игр от Google DeepMind. Может рассуждать о целях, играть в незнакомые игры и самообучаться. Серьёзный шаг к универсальным ИИ-агентам.

> Читать дайджест #93

#дайджест
@ai_newz

GPT 5.1 — вайбы получше 🎧

С этим апдейтом видно большой упор на пользователей, которые остались на 4o из-за того что им не понравилась личность GPT-5 (их, внезапно, довольно много). Первым пунктом в блогпосте идёт то что модель более дружелюбная и что с ней приятнее общаться, при этом бенчмарков там нет совсем.

Кроме этого улучшили следование инструкциям (без цифр), а Instant модель теперь в любом случае будет думать над сложными вопросами. Thinking версию тоже причесали — теперь она тратит меньше компьюта на простые вопросы, а над сложными думает дольше.

Доступ уже раскатывают, начинают с платных пользователей. В API модель должна появится на неделе.

Графики с кайфовым скейлом по оси Y прилагаются, это уже стало визитной карточкой OpenAI.

@ai_newz

Обнов

ление Flow

Пока все следят за хайпом вокруг Sora, Google продолжает тихо, но методично прокачивать Veo. В Flow появился полноценный контроль над камерой, причём уже в готовых генерациях.

Другие модели тоже воспринимают инструкции по движению камеры, но обычно это делается до генерации. Google же добавили возможность делать это после: сначала генерируешь ролик, а потом можешь изменить положение камеры, траекторию её движения или добавить детали через Insert (первые два работают лучше на кадрах со статичной камерой, что логично). Insert, кстати, это буквально видео-инпейнт — выделяешь зону и пишешь, что изменить. И это ещё один камень в огород Runway Aleph, который теперь выигрывает только тем, что в него можно загружать реальное видео.

Insert — очевидно, золотой инструмент для доработки шотов и чистки артефактов. А вот зачем нужны остальные две функции, пока не очень понятно, ведь у Veo с контролем камеры и так всё хорошо, ему не нужен этот костыль, как у старых версий Kling. Пайплайн "генерация статики → добавление движения" звучит странно, разве что для мультикамерного монтажа. Возможно, дельцы в комментариях подскажут зачем это в нейропродакшене. А вот как способ получать дополнительные ракурсы на реальном уже отснятом материале звучит очень интересно. Про бесплатный VFX с Insert, я вообще молчу.

Sora, конечно, подкупает своими мультишот-видео по 25 секунд, но Veo делает ставку на контроль и предсказуемость, а для этого мультишот не нужен.

К слову, Krea и Runway недавно запустили свои ноды, но ведь, по сути, Opal уже имеет такой же функционал. Да, скриптов не хватает, но какие-то простейшие автоматизации по работе с Nano Banana × Veo уже можно строить.

Единственное что смущает, это то что рано или поздно все продукты Гугла оказываются на свалке. Вот не умеют они строить хорошие новые продукты для энд-юзера.

Пока доступно только подписчикам Ultra, но зато безлимитно.

Flow

@ai_newz

Менеджер и директор — это разные роли, которые требуют своего майндсета и навыков. Стратоплан запускает два бесплатных проекта, чтобы помочь сделать этот переход.

Ключевой вызов для менеджера — переключиться из майндсета исполнителя в майндсет руководителя. Если вы становитесь директором, перед вами новая реальность: решения принимаете вы, и нужно не просто реагировать на проблемы, а стратегически смотреть в будущее.

Разобраться в этих ролях помогут на бесплатных интенсивах:
- Менеджер:101 — здесь разберут, из чего на самом деле состоит роль управленца и как действовать в непростых ситуациях. (17-18 ноября).
- Директор:101 — на этом интенсиве научат стратегическому мышлению и принятию решений. (19-20 ноября).

Оба интенсива пройдут с 16:00 до 19:00 (GMT+3). Общая Q&A сессия — 21 ноября.

На выходе участники получат инструменты для работы, сертификат для LinkedIn и материалы от школы, признанной лучшей для руководителей в 2024 году по результатам исследования Devcrowd.

Участие в обоих проектах бесплатное.

Пройти регистрацию на Менеджер:101
Пройти регистрацию на Директор:101

#промо

В X тизерят nano-banana2. По слухам модель будет генерить в разрешении до 4к и будет использовать Gemini 3.0 как текстовый энкодер. Возможно выйдет сегодня (11 ноября).

@ai_newz

Нейродайджест за неделю (#93)

LLM

- Kimi K2 Thinking — Новая модель от Moonshot, крайне сильные бенчи, может выполнять сотни последовательных тул-колов.

Генеративные модели
- Нодовые редакторы — Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI, для большего контроля над генерацией. Закос на про-тулы.

Прочее
- Google Opal — Google раскатали клон n8n с визуальным редактором на кучу стран. Пока сырой и ограничен экосистемой, но хороший способ вкатиться в "нодовую культуру" или сплести бесконечную паутину из нод gemini.
- Embodied Avatar — Unitree показали систему телеуправления роботами. Позволяет управлять всем телом робота через лёгкий экзоскелет или даже повторять движения с видео в реальном времени.

Личное
- Прямое включение из Сан-Франциско — AI-тусовка очень плотная, каждому фаундеру стоит проводить здесь минимум 2-3 недели каждый квартал.

> Читать дайджест #92

#дайджест
@ai_newz

Генеративные инструменты всё больше ориентируются на профессионалов

.

Krea и Runway с разницей в пару недель запустили нодовые интерфейсы, по сути клоны ComfyUI. Они позволяют комбинировать несколько моделей в кастомный пайплайн и делать куда более сложные генерации. По фичам это конечно же отстаёт от Comfy, но сильно лучше по юзабельности — не нужно качать веса, играться с API ключами и т.д.

Больше всего появление таких тулов показывает наличие спроса — студии и фрилансеры готовы платить за дополнительный контроль, который даёт возможность создавать более предсказуемые и качественные результаты для коммерческих проектов, экономя время на итерациях и правках. Если хотите попробовать новые инструменты, то Runway Workflows уже доступен всем подписчикам, а вот Krea Nodes пока ещё в раннем доступе.

@ai_newz

18+

Только для взрослых

Реакция

👍

👎

😀

😯

☹️

😡

Теги: