Лента постов канала Yandex for ML (@yandexforml) https://t.me/yandexforml Yandex for ML — канал для общения и вопросов ML-сообщества от Яндекса, митапы, активности и место встречи специалистов в сфере анализа данных. Чат → https://t.me/+OsKnLNG-7DE1ZTFi Youtube → https://youtube.com/@YandexforML Орг вопросы → @ilikecider ru https://linkbaza.com/catalog/-1001433806174 Wed, 13 Aug 2025 13:02:11 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Mon, 11 Aug 2025 12:40:02 +0300
🍫 Какие шестерёнки крутятся, когда вы ищете товары в Яндекс Лавке

Что легло в основу нашей поисковой системы? Какие модели мы выбрали и почему их несколько? Что будет, если отключить одну из них?

👷 Об этом рассказал Николай Смирнов, ML-инженер в команде поиска Яндекс Лавки. В карточках — история создания поисковой системы Лавки, наглядные схемы и интересности из архитектуры.

🔳 А в полной статье на Хабре ищите ценный практический опыт работы над ML-системами, живые примеры, эксперименты с моделями и много-много технических подробностей.

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Fri, 08 Aug 2025 13:00:11 +0300
💫 Две работы исследователей из Яндекса приняли на ACM RecSys 2025

ACM Conference on Recommender Systems (RecSys) — крупнейшая международная конференция по рекомендательным системам. В 2025 году Amazon, Google и другие лидеры индустрии соберутся в Праге в сентябре, но готовиться к конференции начали уже сейчас.

🔳 Исследователи из Яндекса повезут на конференцию две работы. Одну из них — о новом датасете Yambda — приняли на oral-секцию. Да, это тизер — листайте карточки.

P. S. Почитать обе статьи можно здесь:
⚪️ Correcting the LogQ Correction: Revisiting Sampled Softmax for Large-Scale Retrieval (arXiv)
⚪️ Yambda-5B — A Large-Scale Multi-modal Dataset for Ranking and Retrieval (arXiv, Hugging Face)

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Thu, 07 Aug 2025 18:00:50 +0300
🚀 Открываем коворкинг Яндекса в ротонде Маяковки

Встречаемся в Санкт-Петербурге с 8 по 29 августа под легендарным куполом на Невском проспекте.

В предыдущих сериях наши коворкинги работали в горах на фестивале New Star Camp и на крыше музея «Гараж». Теперь мы перенесли инженерную культуру Яндекса в ротонду, где когда-то собирались писатели и художники.

🥤 Приходите посидеть с ноутбуком в тихой зоне, провести созвон и заварить дрип-лимитку на кофепойнте. А ещё мы придумали целую программу мероприятий, и все они про связь работы, технологий и культуры: от воркшопов до научно-технологического спектакля.

👩‍💻 Петербуржцам и гостям города советуем бронировать места на первую неделю коворкинга прямо сейчас. Разбирают их быстро, но мы регулярно обновляем календарь и по возможности добавляем новые. Главное правило — в один день можно забронировать только один слот на 3 часа.

В общем, сохраняйте:

📆 8–29 августа, понедельник — пятница с 11:00 до 20:00

🗺 Санкт-Петербург, Невский проспект, 20

🔳 Забронировать рабочее место или зарегистрироваться на ивент можно тут

🔛 А следить за новостями лучше всего в отдельном канале коворкинга

🛄 И да, всё бесплатно — и коворкинг, и события в нём

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Wed, 06 Aug 2025 13:02:09 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Tue, 05 Aug 2025 13:01:53 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Mon, 04 Aug 2025 18:01:13 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Mon, 04 Aug 2025 13:04:31 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Fri, 01 Aug 2025 15:00:00 +0300
🎼 Как мы создали виртуального диктора и научили его читать

В прошлом году на Practical ML Conf было много крутых выступлений. Например, доклад Степана Комкова из службы синтеза речи Яндекса о том, как ребята разрабатывали виртуального рассказчика для Букмейта.

Степан рассказал, как родилась эта идея, как команда её воплотила и какие у службы синтеза планы на будущее. В видео показываем принцип устройства базовой модели, а о предыстории и деталях написали ниже

⚪️ Букмейт в числах — это примерно 250 тысяч книг

За год до начала нашего проекта пользователи прослушали около 4 миллионов часов аудиокниг через обычную читалку в браузере. Мы восприняли это как сигнал: нужно дать людям возможность слушать как можно больше книжек в хорошем качестве.

⚪️ Как это сделать?

Профессиональные дикторы — удовольствие дорогое, а базовый синтез речи требует ручной полировки. Поэтому мы решили разработать автоматизированного виртуального рассказчика, который сэкономит нам как время, так и деньги.

⚪️ Проблема в том, что сгенерированная речь сильно утомляет

Поэтому перед нами встало сразу несколько задач: научить виртуального рассказчика читать немонотонно, с паузами, имитацией дыхания и разнообразными интонациями и эмоциями. В общем, синтез должен быть по-человечески неидеальным.

⚪️ Так мы положили начало проекту

В прошлом году мы запустили виртуального рассказчика. Сначала использовали Tacotron с контекстным контролем через PnG BERT, который помогал согласовывать интонацию между предложениями и избегать монотонности. Сейчас же мы переходим на next-gen-методы: модель Tortoise, где GPT-подобная архитектура генерирует токены звука, а кодек превращает их в аудиодорожку.

🔳 Полный доклад Степана ищите в VK Видео и на ютубе — там же будет плейлист с другими выступлениями прошлого года.

🛄 А мы уже открыли регистрацию на PML Conf 2025. Скорее заполняйте форму: чем раньше вы это сделаете, тем больше у вас будет шансов попасть на офлайн.

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Thu, 31 Jul 2025 12:45:01 +0300
📕 Новый мозг для робота: VLA и LLM

В 2024 году большие языковые модели начали дешифровать хаос реального мира: распознавать объекты, объяснять намерения и даже писать код для микроконтроллеров. В эволюции роботов это примерно то же самое, что литийионные аккумуляторы в индустрии ноутбуков.

Раньше всё приходилось делать вручную. LLM же открыли окно возможностей: робот понимает команду (даже в свободной форме), раскладывает её на план действий, анализирует свои ошибки и обучается в прямом эфире. Та же модель, которая распознаёт кота на фото, теперь помогает роботу опознать чашку и понять, что с ней делать.

В статье рассказываем:

⚪️ Чем GPT-мозг круче старой цепочки perception → planning → control
⚪️ Зачем скрещивать Classic Stack, RL-контроллеры и VLA (Vision‑Language‑Action)
⚪️ Как прокачать робота от базовых движений до полноценного помощника

🔳 Читайте статью на Хабре. Внутри: архитектура решения для тех, кто работает с роботами, и всех, кто интересуется технологиями будущего.

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Tue, 29 Jul 2025 13:04:32 +0300
🛎 Открылась регистрация на big tech night

big tech night — «Ночь музеев» в мире IT. Яндекс, Сбер, X5, Т-Банк и Lamoda 12 сентября в Москве откроют двери своих офисов для тех, кто любит технологии.

Присоединяйтесь, чтобы увидеть новые разработки, обменяться экспертизой, найти единомышленников и просто хорошо провести время. В программе — доклады, экскурсии-погружения, лаборатория софт-скилов, роботы, гик-вечеринка и многое другое.

Всего будет 5 треков докладов, каждый привязан к конкретной площадке:

⚪️ Next-Gen Development — офис Яндекса
⚪️ Мультиагентные системы в продукте и бизнес-процессах — офис Сбера
⚪️ Архитектура и управление сложными системами — офис X5
⚪️ AI для SDLC: от кода до прода — офис Т-Банка
⚪️ Создание инфраструктуры для разработки и управление ей — офис Lamoda

Как зарегистрироваться:

🔛 Зайти на этот сайт
🔛 Выбрать 3 локации, которые вы хотите посетить за ночь

Но помните, что первая локация — ключевая. Начать обязательно нужно будет с неё. Здесь вы получите велком-пак big tech night с бейджем и браслетом участника. Он позволит пройти на остальные площадки. Второй и третий офисы можно будет поменять местами, если потребуется.

💻 А ещё можно подключиться онлайн, если вы не в столице.

🛄 Будем ждать вас в офисе Яндекса!

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Mon, 28 Jul 2025 12:01:26 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001433806174 Wed, 23 Jul 2025 15:03:43 +0300
🧿 Как выглядит архитектура индексации миллиарда векторов

С нами связался Александр Зевайкин, руководитель группы разработки ядра распределённой отказоустойчивой базы данных YDB. Недавно ребята добавили туда поиск по векторным индексам. Это очень важная, но сложная в реализации фича: чтобы выкатить её в прод, нужно решить проблемы с производительностью и масштабируемостью.

👷 Как нам всё же удалось спроектировать решение, которое может выдержать нагрузку при поиске в миллиарды объектов — читайте в наших новых архитектурных ML-карточках.

Недавно Александр выступил с докладом, в котором подробно показал, какие варианты архитектуры ребята успели перепробовать, прежде чем всё завелось. Посмотреть его можно здесь.

🔳 А ребята из Yandex Cloud скоро проведут вебинар по реализации сценария RAG на своей СУБД. Тема — «Семантический поиск на базе YDB и LangChain». Регистрируйтесь!

Подписывайтесь:
💬 @Yandex4ML
📹
@Yg>andexML>
Подробнее
]]>