🔥 Мы запускаем третью часть курса DLS
Да, вы все верно прочитали. Уже совсем скоро начнется новый поток "Осень 2025" нашего курса DLS, который пополнился новой частью: Speech Processing.
Программа курса:
🔵 Основные представления аудиосигналов (wav, spectrogram, SSL embeddings, discrete tokens)
🔵 Основные задачи в спиче (ASR, TTS)
🔵 Обзор других ключевых задач в Speech Processing
🔵 Работа с low resource languages и просто non-English языками
🔵 Speech LLM-ки
🔵 ML in Audio
Курс будут вести топовые инженеры в области речи и звука из Huawei, Sber, Звук, EPFL, Amazon (например, авторы статьи GradTTS, GigaAM, автор курса DLA в ВШЭ и автор курса Речевые технологии в МФТИ, авторы каналов VF | Science и Ученый без степени), большинство из которых вы возможно уже знаете.
После курса вы сможете:
— Ориентироваться в задачах Speech-a
— Читать и понимать новые статьи
А также приобретете обширное представление об области в целом!
👇
Ссылка на Stepik
Регистрацию на все потоки осеннего семестра запустим в ближайшее время! Вся информация будет в этом канале 😉