Искусственный интеллект перешел от экспериментов к production-решениям, обрабатывающим миллионы запросов.
На докладах секции «GenAI и большие языковые модели (LLM)» вы сможете разобрать, как строить и масштабировать системы с LLM: от оптимизации инференса и управления GPU-кластерами до построения RAG-систем и fine-tuning моделей под высокие нагрузки. Здесь не о хайпе, а о практических решениях — от выбора фреймворков до экономики GPU-вычислений в масштабе. ⤵️
1️⃣ AI ответы в Яндекс.Поиске: как увеличить счастье пользователей и сэкономить GPU. Алексей Яндутов (Яндекс)
Алексей расскажет, как построили систему выбора LLM под каждый запрос. От простого фильтра с классификаторами к многоуровневому роутингу, который увеличил покрытие в несколько раз, увеличил метрики счастья пользователя и сэкономил сотни GPU. Реальные грабли и готовые решения включены.
2️⃣ Заселение без фронт-деска или как построить бесконтактный сервис в сети отелей на основе RAG. Кирилл Кухарев (Raft)
Почти полная автоматизация фронт-деска отеля от бронирования до решения вопросов проживания при помощи LLM. Практический опыт. Решение в проде.
3️⃣ Строительные блоки LLM‑агентов: планировщик, память, RAG и рабочие цепочки. Алексей Барган (Компания «Тантор Лабс»)
В докладе — пояснение на понятной архитектору и разработчику структуре, из чего состоит агент. Алексей на практике покажет, в каких блоках какие проблемы могут возникнуть.
4️⃣ Агентный подход к матчингу товаров с помощью LLM. Виталий Кулиев (Wildberries & Russ)
Доклад будет интересен своим разбором от и до темы мэтчинга товаров, от небольших кейсов к комплексным сравнениям.
5️⃣ Как перевести разметку на генеративные модели, не уронив качество и стабильность. Дарья Шатько (Яндекс Крауд)
Описание поэтапного внедрения разметки в платформу. Будет интересно всем, кто хочет работать с этой темой и не ошибиться.
Узнайте реальные кейсы снижения latency в 10 раз, организации эффективного батчинга запросов, построения отказоустойчивой архитектуры для AI-сервисов — присоединяйтесь к нам на HighLoad++ 2025 🙌
🖐️ Посмотреть больше докладов секции «GenAI и большие языковые модели (LLM)» и успеть забронировать билет до повышения цены можно на сайте