Лента постов канала Machine learning Interview (@machinelearning_interview) https://t.me/machinelearning_interview @workakkk - присылайте вопросы Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям ru https://linkbaza.com/catalog/-1001713271750 Sun, 17 Aug 2025 17:03:05 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sun, 17 Aug 2025 13:25:51 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sat, 16 Aug 2025 14:10:18 +0300
🚨Bloomberg — сотрудники OpenAI продают акции на $6 млрд SoftBank и другим инвесторам при оценке компании в $500 млрд

📌 Что известно:
- SoftBank и ко выкупают акции сотрудников на $6 млрд
- Ранее SoftBank уже купил $1 млрд акций при оценке $300 млрд
- Если сделка состоится — OpenAI станет самым дорогим стартапом в мире, обогнав SpaceX

💰 Финансовые перспективы:
- Выручка компании вырастет втрое: с $3.7 млрд в 2024 → до $12.7 млрд в 2025
- Всё это на фоне релиза GPT-5

🗣 Сэм Альтман:
> «Мы собираемся вложить триллионы в инфраструктуру ИИ. Дайте нам делать своё дело.»

🔥 Оценка в полтриллиона делает OpenAI главным игроком в новой технологической гонке.

📌 Источник
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 15 Aug 2025 14:43:47 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 15 Aug 2025 13:03:25 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 15 Aug 2025 11:57:40 +0300
🚀 Интересуетесь нейросетями и хотите понять, как эволюция архитектур RNN и Transformer влияет на NLP?🚀

На открытом уроке «От RNN до Transformers: скорость, память, контекст» 19 августа в 20:00 МСК мы разберём, как работают рекуррентные нейросети (RNN), их ограничения и почему современные NLP-системы всё чаще переходят к трансформерам. Мы сравним эти архитектуры по ключевым параметрам: скорости, памяти, контексту и масштабируемости.

Урок даст вам чёткое представление о том, как меняются подходы в обработке текста, а также объяснит, почему трансформеры становятся основой современных NLP-систем.

📚 Посетите вебинар и получите скидку на большое обучение «NLP / Natural Language Processing»:  https://otus.pw/QKft/?erid=2W5zFK8ZKSY

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 14 Aug 2025 21:50:11 +0300
🦕 DINOv3 — новая мощная модель компьютерного зрения, обученная полностью без разметки (Self-Supervised Learning) в большом масштабе.

DINO создаёт высококачественные плотные признаки, отлично понимая как смысл (семантику) сцены, так и её геометрию.

Зачем это нужно:

1️⃣ Больше не нужны размеченные данные
Раньше на ImageNet лучшие результаты показывали модели с полной или слабой разметкой. Теперь DINOv3 с чистым SSL догнал их по качеству — и это огромный шаг вперёд.

2️⃣ Сильные плотные представления
Модель особенно хороша в задачах, где важны детальные признаки: мульти-модальные LLM, видео и 3D-анализ, робототехника, генеративные модели.
С замороженным ❄️ backbone DINOv3 получены новые рекорды:
- Обнаружение объектов: 66.1 mAP (COCO)
- Сегментация: 63 mIoU (ADE)
- Оценка глубины: 4.3 ARel (NYU)
Даже встраивание в готовые пайплайны даёт новый SOTA.

3️⃣ Модель под любую задачу
- ViT-7B — флагман
- ViT-S/S+/B/L/H+ (от 21M до 840M параметров)
- ConvNeXt — для быстрого инференса
- Text-aligned ViT-L (dino.txt)
- ViT-L/7B для спутниковых снимков

📡 Для спутниковых данных DINOv3 даёт топовые результаты в геопространственных задачах, например в оценке высоты деревьев, и создаёт впечатляющие карты признаков.
Это и есть магия SSL — универсальные признаки, которые работают в самых разных областях.

📌 Github

@machinelearning_interview

#dino3 #cv #ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 14 Aug 2025 21:30:04 +0300
🎉 Розыгрыш завершен!

🏆 Победители:1. Вик (@Vity_OMSKAGD)
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 14 Aug 2025 16:05:03 +0300
📘 GeostatsGuy выпустили интерактивный учебник по ML с десятками анимаций и интерактивных демо.

🧠 Что внутри:
— Простые объяснения ключевых концепций
— Как работает регрессия, классификация, деревья решений
— Анимации градиентного спуска, переобучения, кросс-валидации
— Наглядные примеры для всех основных алгоритмов

Идеально для студентов, начинающих аналитиков и тех, кто хочет «прочувствовать» машинное обучение, а не просто заучить формулы.

🔗 Читать учебник

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 14 Aug 2025 15:37:33 +0300
xAI теряет ключевого лидера: сооснователь и главный инженер Игорь Бабушкин уходит спустя чуть больше двух лет работы. Он запускает Babuschkin Ventures — фонд, который будет инвестировать в исследования и стартапы, делающие упор на безопасный ИИ и долгосрочное благополучие человечества.

Уход Бабушкина происходит на фоне стремительного роста xAI — от строительства суперкомпьютера Memphis до бурных споров вокруг чатбота Grok.

💥 Кто займёт место технического лидера?
В кулуарах всё громче звучит имя Андрея Карпаты — звезды AI-индустрии, работавшего с Маском в Tesla и OpenAI, а сейчас развивающего свой стартап Eureka Labs. Его опыт масштабирования нейросетей и свежие похвалы в адрес Grok 3 подогревают слухи о возможном возвращении в «экосистему Маска».

🎯 Среди других кандидатов — внутренние инженеры xAI и ветераны отрасли, включая бывших исследователей OpenAI и DeepMind. Маск известен громкими и рискованными назначениями, так что сюрпризы возможны.

🚀 Уход Бабушкина — это поворотный момент: кому-то предстоит не только удержать темп, но и задать новый вектор в гонке за суперинтеллектом.
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 14 Aug 2025 12:33:32 +0300
💼 Как подготовиться к любому собеседованию: гайд от нового сотрудника OpenAI

Новый инженер OpenAI поделился опытом прохождения интервью в AI-стартапы и крупные компании, включая OpenAI.

1. Заботьтесь о себе — ментально и физически
Интервью — это стресс. Следите за сном, питанием, отдыхом, заручитесь поддержкой друзей и семьи.

2. Помните: цель — ваш успех
Компания и интервьюеры хотят, чтобы вы прошли. Даже если был отказ, пробуйте снова — многие успешно попадали на роль со второй попытки.

3. Получайте удовольствие от процесса
Это шанс познакомиться с интересными людьми, узнать новые технологии и потренироваться в решении задач.

4. Готовьтесь основательно
- 100 часов на задачи (LeetCode и аналоги)
- 100 часов на изучение теории и статей
- Тренируйтесь с друзьями без автодополнений и LLM-подсказок

5. Каждая встреча важна
Даже «неформальный звонок» — это возможность показать мотивацию, характер и профессионализм.

6. Работайте над профилем и сетью
LinkedIn, GitHub с проектами, участие в митапах, open-source, хакатонах — всё это привлечёт внимание рекрутеров.

7. Первые звонки
- С рекрутером: записывайте детали — этапы, состав команды, имя руководителя
- С руководителем: изучите его публикации и проекты, покажите интерес, расскажите, почему хотите работать именно здесь

8. Поведенческие вопросы
Готовьте истории по формату STAR(I) — о том, как решали конфликты, брали на себя лидерство, справлялись с ошибками.

9. Техническая часть
- Решайте задачи быстро и чётко, проговаривая ход мыслей
- Практикуйте кодинг в условиях стресса и без IDE
- Разбирайтесь в алгоритмах, трансформерах, RL-методах
- Умейте объяснить свою текущую работу и её пользу для компании

10. Переговоры
Обсуждайте не только зарплату, но и команду, миссию, культуру. Все договорённости фиксируйте письменно.

11. Принятие решения
Выбирайте место, где вам будет комфортно работать каждый день.

📌 Главное: интервью — это навык, который можно натренировать. Подготовка + уверенность = высокий шанс успеха.

📌 Полный текст

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 13 Aug 2025 11:09:05 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 20:31:05 +0300
🚀 Вышла Mistral Medium 3.1

- Повышена общая производительность
- Улучшен тон общения
- Обновлена и улучшена работа в вебе

Попробовать можно в Le Chat (стоит как модель по умолчанию)

или через API: mistral-medium-2508
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 20:04:51 +0300
🚀 SWE‑Swiss: рецепт обучения LLM для быстрого решения багов

SWE‑Swiss-32B — модель с 32 млрд параметров, оптимизированная для эффективного исправления программных проблем.

Что входит в рецепт обучения:
- Мulti‑Task Fine‑Tuning + Reinforcement Learning — обучаем модель сразу на нескольких навыках и усиливаем через RL.
- Ключевые навыки:
- Локализация ошибок (файлы)
- Генерация патчей
- Создание unit-тестов

По результатам тестов на SWE‑bench Verified, модель показывает производительность на уровне передовых закрытых моделей, несмотря на свою среднюю размерность.

Плюсы:
- Доступно на Hugging Face под лицензией MIT
- Использует transformers — просто интегрировать в пайплайн

Почему это круто:
SWE‑Swiss — пример того, как грамотно комбинация мультизадочного обучения и RL позволяет добиться высоких результатов в решении понятийно сложных задач, делая LLM доступнее и эффективнее для разработчиков.

📑Notion: https://pebble-potato-fc6.notion.site/SWE-Swiss-A-Multi-Task-Fine-Tuning-and-RL-Recipe-for-High-Performance-Issue-Resolution-21e174dedd4880ea829ed4c861c44f88?pvs=143
💻Github: https://github.com/zhenyuhe00/SWE-Swiss
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 19:00:48 +0300
📘 Готовитесь к ML-собеседованию? На Stepik вышел курс — «Vector DB & RAG Developer»

Этот курс закрывает типичные вопросы интервью: эмбеддинги, ANN-индексы (HNSW/IVF/IVF-PQ), тюнинг ef_search/M, выбор индекса под 1–10 млн векторов, метрики Recall@K / nDCG и ошибки RAG.

🔍 Что вы получите:
• Практика с Qdrant, Weaviate, FAISS: от эмбеддингов до продакшн-RAG
• 200+ интерактивных заданий и кейсов в стиле собес-вопросов
• Лабы с ручным рецензированием + готовые Python-шаблоны
• Чек-листы для интервью: «как объяснить HNSW», «как обосновать метрики», «как выбрать индекс»

🎓 Cертификат Stepik — добавьте в резюме или LinkedIn

🚀 Начните сегодня и получите скидку 25 % в течение  24 часов

👉 Пройти курс на Stepik
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 16:31:05 +0300
🔥 Маск обвинил Apple в нарушении антимонопольного законодательства

Поводом стало размещение в App Store — Apple отказалась добавить X и Grok от xAI в секцию “Must Have”, хотя X лидировал в новостных чартах, а Grok был близок к топу общего рейтинга.

📈 Накануне xAI сделали Grok 4 бесплатным для ограниченного числа запросов, что резко ускорило установки и подняло приложение в топ.


@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 14:01:08 +0300
GPT-5 - настоящий гений, говорили они
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 13:37:49 +0300
⚡️ Nvidia на SIGGRAPH 2025: самое главное.

На конференции SIGGRAPH 2025 Nvidia представила свою центральную концепцию — "Физический ИИ".

Это конвергенция ИИ и компьютерной графики для создания систем, способных действовать в реальном мире, будь то роботы, автономные автомобили или умная инфраструктура.

🟡Новое железо на архитектуре Blackwell.

Для дата-центров представили GPU Nvidia RTX PRO 6000 Blackwell Server Edition для стандартных корпоративных серверов форм-фактора 2U. Системы на его базе смогут достигать до 45 раз более высокой производительности и в 18 раз лучшей энергоэффективности по сравнению с чисто процессорными решениями.

Тензорные ядра пятого поколения с поддержкой формата FP4 бустят инференс в 6 раз по сравнению с предыдущим поколением L40S.

Для рабочих станций анонсировали две компактные видеокарты: Nvidia RTX PRO 4000 SFF Edition и RTX PRO 2000 Blackwell.

Первая обеспечивает до 2.5 раз более высокую производительность в ИИ-задачах при том же энергопотреблении в 70 Вт, а вторая в 1.4 раза быстрее в CAD-приложениях.

🟡Физический ИИ для робототехники.

Для Omniverse анонсировали новую библиотеку NuRec, которая реконструирует реальные окружения из данных сенсоров с помощью 3D Gaussian splatting.

Приложения для симуляции Isaac Sim 5.0 и Isaac Lab 2.2 теперь доступны в виде опенсорс-проектов на GitHub.

В качестве примера показали кейс Amazon, где CAD-модели новых продуктов загружаются в Isaac Sim для генерации более 50 000 синтетических изображений. На этих данных обучаются ИИ-модели, которые затем управляют роботизированными манипуляторами для контроля качества продукции — и все это без каких-либо физических модификаций оборудования.


🟡Новые семейства ИИ-моделей.

Для корпоративных задач линейку Nemotron расширили моделями Nemotron Nano 2 и Llama Nemotron Super 1.5. Они предназначены для выполнения сложных многоэтапных задач в кибербезопасности или клиентском сервисе.

Специально для "Физического ИИ" была разработана 7-миллиардная VLM Cosmos Reason. Ее задача - позволить роботам и агентам интерпретировать физический мир, используя априорные знания, понимание физики и "здравый смысл". Эту модель уже использует Uber для для анализа поведения автономных автомобилей.

🟡Платформа для умных городов и производств Metropolis.

Платформа дополнена интеграцией с VLM Cosmos Reason, новыми vision-моделями в TAO Toolkit и расширениями для Isaac Sim, позволяющие генерировать редкие сценарии обучения.

@ai_machinelearning_big_data

#news #ai #ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 12 Aug 2025 12:08:45 +0300
✔️ Сheating daddy - поможет готовься к самым сложным собеседованиям эффективно.

Инструмент помогает:
• Тренировать ответы для HR и техблока.
• Подбирать точные формулировки и структуры ответов.
• Разбирать примеры кода и типовые задачи.
• Освежать в памяти ключевые алгоритмы и структуры данных.
• Находить и исправлять технические неточности в объяснениях.

Без «невидимых» подсказок во время интервью — только качественная подготовка. Поддерживает популярные LLM-API, работает быстро и стабильно.

Готовься умно — выходи на оффер увереннее.

📌 Github

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 11 Aug 2025 20:16:01 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 11 Aug 2025 19:09:56 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 11 Aug 2025 10:15:07 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sun, 10 Aug 2025 21:04:04 +0300
🎨 X-Omni от Tencent: прорыв в text-to-image генерации. Новая модель X-Omni демонстрирует, как reinforcement learning может вывести авторегрессионные text-to-image системы на новый уровень. В основе — гибридная архитектура: SigLIP-VQ токенизирует изображения, Qwen2.5-7B обрабатывает мультимодальные данные, а диффузионный декодер FLUX.1-dev завершает рендеринг.

Интерес вызывает комплексная reward-система, оценивающая результат по эстетике, семантике и читаемости текста. На тестах модель превзошла GPT-4o в рендеринге надписей, особенно для китайского языка. При этом X-Omni стабильно работает без CFG, что выделяет её среди аналогов.

🔗 Ссылка - *клик*
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sat, 09 Aug 2025 13:04:48 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 08 Aug 2025 14:04:05 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 08 Aug 2025 13:55:20 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 08 Aug 2025 12:27:34 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 07 Aug 2025 21:40:39 +0300
🤖 Вот сравнение GPT‑5 и Grok 4:

На бенчмарке *Humanity’s Last Exam* модель GPT‑5 с тулзами показывает результат между Grok 4 и Grok 4 Heavy.

Другими словами, GPT‑5 с тузами обходит обычную Grok 4, но всё ещё уступает Grok 4 Heavy.

Интересно, как они покажут себя на других бенчмарках
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 07 Aug 2025 20:17:36 +0300
🔥 представлен ChatGPT-5

Модель выглядит очень круто, особенно в кодинге! На aime-2025 получила 100 процентов!

Альтман заявляет, что модель дадут даже бесплатным пользователям и прямо сегодня.

https://openai.com/index/introducing-gpt-5/

Стрим, кстати, смотрят 155 к человек: https://www.youtube.com/watch?v=0Uu_VJeVVfo

Пробуем: https://chatgpt.com/

@ai_machinelearning_big_data

#Chatgpt5
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 07 Aug 2025 14:52:03 +0300
🧠 GPT‑5 по утечкам (или PR самого OpeAI) набрал 90% на SimpleBench — это уровень человека

По слухам, новый бенчмарк от Copilot показывает, что GPT‑5 достигает 90% точности на SimpleBench — наборе из ~200 сложных вопросов с множественным выбором.

❓ Что тестирует SimpleBench:
• Пространственно-временное мышление
• Социальную логику
• Адверсариальные ловушки на здравый смысл

📌 Почему это важно:
90% — это уже уровень человеческого здравого смысла в таких задачах. А ведь модели до этого еле приближались к этим значениям даже с цепочками размышлений.

Если слух подтвердится — GPT‑5 не просто умнее. Он начинает понимать контекст как человек.

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 07 Aug 2025 13:02:03 +0300
💾 Awesome-Efficient-LLM — коллекция методов оптимизации больших языковых моделей. Этот репозиторий объединяет последние исследования по ускорению и сжатию LLM: от квантования и sparse-методов до архитектурных оптимизаций. Особенно полезны разделы про speculative inference и mixture-of-experts — ключевые направления для реального развертывания моделей.

Проект полезен инженерам, которые хотят внедрить LLM в production с минимальными затратами ресурсов. Все работы отсортированы по дате публикации и области применения.

🤖 GitHub

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 07 Aug 2025 11:04:27 +0300
Лайк, если тоже устали от хайпа вокруг ИИ

Нужен ли он бизнесу? Поймете с ML Impact – медиа про реальную пользу технологий в бизнесе от команды Selectel.

Собрали понятные материалы без технической воды:

- как технологии Edge AI трансформируют бизнес в 2025 году,
- как не переплатить за автоматизацию,
- как подготовить бизнес к запуску ML-проекта.

Переходите и читайте, чтобы внедрить ИИ в бизнес осознанно и без рисков: https://slc.tl/czuon

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqvwetLH
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 06 Aug 2025 20:45:14 +0300
🚀 Опенсорс от OpenAI теперь в Yandex Cloud AI Studio

OpenAI впервые с 2019 года открыла исходники своих рассуждающих моделей — gpt‑oss‑120b и gpt‑oss‑20b. Уже сегодня их можно гонять по API в Yandex Cloud.

⚡ Сравнимо с o3‑mini и o4‑mini, в ряде задач — лучше GPT‑4o и o1
⚡ Настраиваемая интенсивность reasoning + скорость генерации
⚡ Хостинг и обработка данных в РФ — полное соответствие ФЗ‑152
⚡ Без мороки с мощностями, обновлениями и мониторингом

💡 Для чего: автоматизация рекрутмента и саппорта, анализ документов, первичная коммуникация с клиентами. Цена вопроса – 10 или 30 копеек за 1000 токенов в зависимости от модели.

Скоро — вызов функций и поиск в интернете прямо в ответе.

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 06 Aug 2025 19:05:11 +0300
👿 26 августа Яндекс проведёт в Санкт-Петербурге Data Dojo: мероприятие для сообщества ML-экспертов

Будем обсуждать востребованные направления машинного обучения, разбирать реальные задачи из соревнований и общаться с руководителями команд, чтобы узнать больше о карьере ML’щика в Яндексе.

Николай Савушкин, руководитель команды рекомендательных технологий в Поиске, расскажет, как устроена персонализация и как работают большие генеративные модели в рекомендательных системах Яндекса. А Алексей Колесов, руководитель команды NLP, поделится, каких успехов за последнее время добилась команда R&D в Яндексе, и какие вызовы стоят перед ними в ближайший год.

Вечером — дискуссия с секретным гостем, а после — afterparty с музыкой и напитками.

Если хотите стать спикером, необходимо заполнить специальную форму до 13 августа. Программный комитет выберет одну из заявок и пригласит её автора выступить на встрече.

Если хотите участвовать, то нужно заполнить анкету до 20 августа.

🪷 В додзё не приходят случайно. Набирайтесь мудрости в сильнейшем ML-комьюнити.
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 06 Aug 2025 16:10:13 +0300
🧠 StepFun‑Prover Preview: 32B‑модель обучилась доказывать теоремы, общаясь с Lean 4

📌 Что делает классический prover :
Он просто перебирает возможные доказательства, не зная, в каком направлении двигаться. Это как угадывать код на замке: пробуешь один вариант, не подошло — пробуешь следующий.

📌 Что делает новая модель StepFun‑Prover)
Она "разговаривает" с Lean 4 — проверяющей системой формальных доказательств. Если модель предлагает доказательство и Lean выдает предупреждение или ошибку, модель читает это как обратную связь и учится. В следующий раз она делает более точную попытку.

🧠 В итоге:

Вместо перебора 30+ вариантов вслепую, как у обычных систем, модель с первого раза решает до 70 % задач, потому что понимает и учитывает отклик от системы.

Это как решать задачу в школе, где тебе не просто говорят «неправильно», а объясняют, что именно не так — и ты быстро учишься.

🔍 Как это работает:
- Исходные задачи из Lean очищаются и превращаются в набор для обучения синтаксису и вызовам тактик.
- На этих данных обучаются 7B и 32B‑модели на базе DeepSeek, с последующей правкой ошибок Kimina‑Prover.
- Модель учится смешивать обычный текст, код на Lean и sandbox‑ответы — всё в одном длинном контексте.
- Вознаграждение бинарное: если Lean-программа принимает доказательство — 1, иначе — 0.

📈 Результат:
- 32B‑модель обходит конкурентов на 72B более чем на 5 % (при этом использует **1 попытку вместо 32**).
- Увеличение длины контекста с 4K до 20K токенов повышает pass@1 с 58 % до 70 %.
- Модель сокращает доказательства, читая варнинги и на лету рефакторя тактики.

📦 Open‑веса (7B и 32B) выйдут скоро — можно будет запускать даже на скромном GPU.

📄 Paper: https://arxiv.org/abs/2507.20199
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 06 Aug 2025 14:09:01 +0300
Когда гайды молчат, важно услышать себя

Если вы только начинаете путь в ML, хотите сменить профессию или находитесь в поиске направления после учёбы — информации вокруг много, но она не всегда помогает сориентироваться. Туториалы быстро устаревают, статьи противоречат друг другу, а самые важные вопросы остаются без ответов: с чего начать? Какие навыки нужны? Как построить маршрут к первой работе?

7 августа в 18:00 по МСК karpovꓸcourses проведут бесплатный вебинар с Нерсесом Багияном, руководителем направления по работе с данными. Он поделится своей карьерной историей — от стажера до руководителя направления — и расскажет, как сегодня выглядит работа ML-инженера, какие задачи он решает и какие навыки важны в 2025 году. Все на примерах из реального опыта.

Если вы ищете точку опоры в старте карьеры — начните с этого вебинара: https://clc.to/erid_2W5zFGq4jZ2

Это старт Data-интенсива: от новичка до оффера, который поможет сориентироваться в сфере Data Science и перейти к первым шагам 🤝🏻

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFGq4jZ2
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 06 Aug 2025 12:41:29 +0300
🚨 MiniCPM‑V 4.0 - не chatgpt едимным!

✨ Что нового:
— 🧱 4.1B параметров
— 🧠 По визуальному пониманию догоняет GPT‑4.1‑mini (по OpenCompass)
— ⚡ Работает на iPhone 16 Pro Max — 17.9 токенов/сек
— 📊 69.0 баллов на OpenCompass (против 65.2 у MiniCPM‑V 2.6 8B)
— 🔥 Маленькая модель, большая мощность

📁 GitHub: https://github.com/OpenBMB/MiniCPM-o
🤗 Hugging Face: https://huggingface.co/openbmb/MiniCPM-V-4

#AI #LLM #MLLMs #MiniCPM #EdgeAI
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 05 Aug 2025 20:03:11 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 05 Aug 2025 10:42:43 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 04 Aug 2025 17:01:48 +0300
📚 Устали от скучных ML туториалов?

Вот полезная подборка:
300+ кейсов по ML-системам из реальной практики компаний вроде Stripe, Spotify, Netflix.

Тут не теория, а как всё реально работает в проде:
— как устроены пайплайны
— как деплоят модели
— как делают мониторинг
— какие ошибки бывают и как их решают

👍 Подойдёт для подготовки к собеседованиям и просто чтобы разобраться, как строят ML‑системы в крупных компаниях.

🔗 https://github.com/eugeneyan/applied-ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 04 Aug 2025 14:56:41 +0300
💥 Китайская AI-модель по математике — абсолютный прорыв

Свежая научная статья из Китая показала не просто сильную, а *лучшую в мире* AI-модель для решения олимпиадных задач по математике:

🏅 Модель взяла золото на IMO 2025
📈 Решает 78% всех задач прошлых IMO
🧠 Покрывает более 50% задач Putnam
✅ Даёт 100% точность на miniF2F (тест от OpenAI)
⚔️ Обходит AlphaGeometry2 от Google

📌 Как работает:
- Использует формальные доказательства на языке Lean
- МОдель открыл новые методы для решения геометрии, которых раньше не было
- Первая лаборатория, которая опубликовала полноценную статью о внутренностях модели

AI в математике выходит на новый уровень — и Китай сейчас показывает, что он идет в авангарде открытий.

📌
Статья

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sun, 03 Aug 2025 12:04:25 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sun, 03 Aug 2025 10:43:11 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sat, 02 Aug 2025 10:56:02 +0300
🚀 MLE‑STAR от Google Research — новый state‑of‑the‑art агент для ML-инжиниринга

Google представил MLE‑STAR — агент на основе LLM, который автоматизирует ML-задачи разных типов (табличные данные, изображения, текст и др.) и достигает высот в сравнении с предыдущими подходами.

Что нового:

• Использует веб‑поиск для поиска современных моделей и примеров кода, чтобы создать начальное решение
• Делает абляционный анализ (ablation study), чтобы определить наиболее влиятельный компонент в ML-пайплайне, и итеративно дорабатывает его
• Развивает энсемблирование: генерирует несколько решений и собирает их в одно улучшенное, опираясь на стратегию агента
• Включает модули контроля: дебаггер, проверку утечек данных и контроль использования всех источников данных, чтобы избежать плохих практик

🧪 Результаты:
MLE‑STAR выигрывает медали в 63–64 % из бенчмарка MLE‑Bench‑Lite (Kaggle), обгоняя лучшие существующие методы (~25–26 %)

🛠 В чем плюсы:
- Снижает порог входа в ML для инженеров и организаций
- Обеспечивает адаптивность: агент извлекает свежие знания из сети, поэтому решения автоматически улучшаются с развитием ML
- Открытый исходный код — можно протестировать или встроить в собственные пайплайны

💡 Как работает:
1. Поиск нужных моделей через веб
2. Генерация и слияние лучших кандидатов
3. Абляционный анализ → выбор блока → уточнение этого блока
4. Итеративное улучшение и объединение ансамблей
5. Контрольные модули: дебаг, утечки, использование данных

🔜 Подробнее

@machinelearning_interview

#Google #GoogleResearch #ml #mle #llm
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 01 Aug 2025 10:54:50 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 31 Jul 2025 18:30:42 +0300
🚀 Step 3 — новая звезда среди мультимодальных open-source моделей

StepFun представили Step 3 — мощную и удивительно быструю VLM‑модель, которая может работать даже на доступных GPU.

🔷 321B параметров (38B активных) — всё для топ‑производительности и дешёвого инференса
🔷 Новые подходы MFA + AFD — ускоряют работу модели и снижают требования к железу
🔷 Обучена на 20+ трлн токенов, из них 4T мультимодальные (текст + изображение)
🔷 До 4 039 токенов/сек/на GPU — на 70% быстрее, чем DeepSeek‑V3
🔷 Минимум галлюцинаций, максимум логики — особый фокус на качество данных

💎 Step 3 устанавливает новую Pareto‑границу между мощностью, скоростью и реальной практичностью.

🔗 Попробовать: https://huggingface.co/stepfun-ai/step3
📖 Блог: https://stepfun.com/research/zh/step3
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 31 Jul 2025 16:50:20 +0300
В Авито появилась новая ключевая должность — управляющий директор по искусственному интеллекту. Её занял Андрей Рыбинцев, один из пионеров развития ИИ в России. Этот шаг — важный этап в технологической стратегии компании по внедрению искусственного интеллекта в экосистему Авито.

«Искусственный интеллект расширяет возможности человека, позволяет достигать большего. Но человеческое мышление с его способностью адаптироваться, находить нестандартные решения и проявлять гибкость остается незаменимым. Мы создаем симбиоз, где каждый делает то, что умеет лучше всего», — рассказывает Андрей в большом интервью TechInsider.

Авито развивает ИИ уже более 10 лет. За это время удалось автоматизировать почти всю обработку пользовательского контента.

«Сегодня 99% контента обрабатывается ИИ, и только 1% самых сложных вопросов передается модераторам для экспертной оценки. Если бы не алгоритмы, нам пришлось бы нанять на 100 тыс. больше сотрудников, чтобы справиться с таким объемом», — объясняет Андрей.

Еще один ИИ-инструмент — ассистент продавца. Он отвечает на самые популярные вопросы покупателей, опираясь на данные из объявлений.

«Почти все вопросы кто-то задавал до вас, и система это знает. Информацию для них он находит в объявлении: уточнит размер, состояние, доступность товара и т.д. Правда, заключать сделки мы ему пока не доверяем. Но ответить на все вопросы, которые приведут к сделке, он может», — добавляет Рыбинцев.
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 31 Jul 2025 11:38:17 +0300
🖥 120 ключевых вопросов по SQL за 2025 год

Статья содержит 120 ключевых вопросов по SQL для собеседований, разделённых по темам и уровням сложности, с краткими пояснениями.

Основываясь на актуальных требованиях 2025 года, вопросы охватывают базу данных, оптимизацию, практические задачи и нюансы СУБД (MySQL, PostgreSQL, SQL Server).

🔜 Подробности

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 30 Jul 2025 12:41:17 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 29 Jul 2025 13:04:45 +0300
📊 MLU — практический курс по табличными данным. Бесплатный образовательный проект от Amazon для погружения в машинное обучение. Включает видео-лекции, Jupyter-ноутбуки и реальные датасеты для отработки методов работы с табличными данными.

Курс охватывает все этапы — от разведочного анализа до нейросетей и AutoML. Особый акцент сделан на feature engineering и классические алгоритмы.

🤖 GitHub

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 29 Jul 2025 12:16:42 +0300
😤 Anthropic становится с каждым днём всё хуже:

— Ужасные лимиты
— Дорогие тарифные планы
— Теперь ещё и недельные ограничения

Единственное, что их спасает — лучшая кодинг‑модель.

Но как только выйдет GPT‑5 или кто-то сделает что-то лучше — их сметут.

⏳ Ждём смены лидера для вайбкодина.
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 28 Jul 2025 14:01:14 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sun, 27 Jul 2025 17:01:15 +0300
🧠 Intern-S1 — мощная open-source модель для мультимодальных научных задач

Команда InternLM представила Intern-S1 — продвинутую модель, способную обрабатывать и текст, и изображения, включая научные данные.

Что под капотом:
– Языковая модель 235B (MoE) + визуальный энкодер 6B
– Предобучена на 5 триллионах токенов, больше половины — научные данные
– Понимает молекулярные формулы, белковые последовательности, сейсмические сигналы — благодаря динамическому токенизатору
– Сопоставима по качеству с закрытыми коммерческими моделями в научных бенчмарках

🤗 HuggingFace: https://huggingface.co/internlm/Intern-S1-FP8
💻 GitHub: https://github.com/InternLM/Intern-S1
🌐 Онлайн-демо: https://chat.intern-ai.org.cn

@machinelearning_interview

#ml #ai #Intern
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sat, 26 Jul 2025 14:20:09 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sat, 26 Jul 2025 13:18:47 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 25 Jul 2025 19:40:13 +0300
🔮 SuperDuperDB — фреймворк для создания AI-приложений, напрямую интегрированных с базами данных. Позволяет развертывать модели машинного обучения и векторные поиски прямо в MongoDB, SQL, Snowflake или Redis, избегая сложных ETL-процессов.

Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.

🤖 GitHub

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 25 Jul 2025 17:38:01 +0300
Яндекс представил крупнейшую языковую модель в облаке — Qwen3‑235B.

Она поддерживает работу с длинным контекстом, владеет 119 языками и обеспечивает высокое качество генерации. Модель доступна в Yandex AI Studio: можно протестировать в интерфейсе или подключить через API.

Стоимость начинается от 50 копеек за 1000 токенов.

Реклама. ООО Яндекс.Облако. ИНН 7704458262
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Fri, 25 Jul 2025 14:01:46 +0300
🌠 CoreML-Models — коллекция готовых ML-моделей для iOS-разработчиков. Этот репозиторий содержит более 50 предобученных моделей машинного обучения, конвертированных в формат CoreML для легкой интеграции в iOS-приложения. Среди них — классификаторы изображений, детекторы объектов, модели для сегментации и даже Stable Diffusion для генерации изображений.

Все модели доступны через Google Drive с указанием лицензий оригинальных проектов. Для удобства разработчиков есть примеры интеграции в Xcode и скрипты для конвертации дополнительных моделей.

🤖 Github

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 24 Jul 2025 17:03:27 +0300
📊 Metabase — это мощная и простая в использовании платформа для бизнес-аналитики!

🌟 Она позволяет визуализировать данные, создавать отчёты и дашборды, а также находить инсайты без необходимости писать сложные SQL-запросы. Metabase поддерживает подключение к различным базам данных, включая MySQL, PostgreSQL, MongoDB и другие, предоставляя интуитивный интерфейс для работы с данными.

🔐 Лицензия: AGPL-3.0

🖥 Github

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 24 Jul 2025 14:59:27 +0300
Когда я решил сменить профессию и пойти в IT, было ощущение, будто ныряю в незнакомую воду. Я уже немного писал код, сделал пару проектов по туториалам, прошёл курс. Казалось, вот-вот начну — но как только дошло до реального поиска работы, возникла куча вопросов.

Куда откликаться? Что вообще писать в резюме, если до этого работал в другой сфере? Как показать, что ты не просто «посмотрел пару видео», а реально готов к работе? И как пройти собеседование, не впав в ступор от первого же вопроса?

На все это ушло много времени и нервов — методом проб, ошибок и пустых откликов. Сейчас понимаю: без чёткой стратегии в этом хаосе легко потеряться.

🗺 Как раз такую стратегию подготовил Яндекс Практикум.  
Они выпустили понятный и конкретный гайд по поиску первой работы в IT — с разбором, как устроен найм, что важно работодателям и как новичку не потеряться на старте.

📌 В гайде есть ответы на главные вопросы:

— Как составить резюме, если нет опыта?  
— Как грамотно показать обучение и проекты?  
— Где искать вакансии, чтобы не тратить месяцы впустую?  
— Как пройти интервью и не сгореть от волнения?

🎥 Плюс у Практикума есть большая подборка видео от карьерных экспертов:
→ как выделиться среди других,  
→ как оформить резюме,  
→ как уверенно пройти собеседование.

Скачать гайд можно под этим постом, а посмотреть видео с экспертами по ссылке. Всё чётко, по делу и без лишней воды.

Реклама, АНО ДПО “Образовательные технологии Яндекса”, ИНН 7704282033
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Thu, 24 Jul 2025 12:23:34 +0300
🧠 Sam Altman: целые профессии исчезнут из‑за ИИ — и это уже началось

Выступая в Вашингтоне, CEO OpenAI заявил:

🗣️ “Некоторые профессии, как, например, поддержка клиентов — просто исчезнут. Совсем. Звонок в поддержку? Это будет ИИ — и это нормально.”

📞 По его словам, современные линии поддержки уже работают на больших языковых моделях:
— мгновенные ответы
— ноль переводов
— минимум ошибок

🩺 Та же технология помогает в медицине: ИИ учится на миллионах пар “симптом → диагноз” и быстрее врачей находит причины болезней.

⚠️ Но есть и тёмная сторона:
“Представьте: враждебная страна соединяет ИИ с кибератаками — и за секунды стирает балансы или останавливает биржи. Вот это меня пугает.”

🔜 Полный материал

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 23 Jul 2025 13:22:33 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Wed, 23 Jul 2025 11:48:36 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 22 Jul 2025 14:02:09 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 22 Jul 2025 12:02:50 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Tue, 22 Jul 2025 11:09:27 +0300
Подробнее
10.97 k
]]>
https://linkbaza.com/catalog/-1001713271750 Mon, 21 Jul 2025 11:48:10 +0300
🤖 ChatGPT Agent vs. Genspark Super Agent — битва ИИ-ассистентов нового поколения

Не так давно OpenAI выпутили ChatGPT Agent, способного выполнять сложные многошаговые задачи — от ресёрча до автоматизации. Но Genspark пошёл ещё дальше и предлагает интеллектуального супер-агента, ориентированного на пользователей и сложные команды.

🔹 ChatGPT Agent
— Доступ к браузеру, API, терминалу
— Глубокий поиск + Gmail/Calendar интеграция
— Контроль, безопасность и прозрачность
— Идеален для профессиональных пользователей и команд, которым важна защита данных и максимальный контроль

🔹 Genspark Super Agent
— No-code-процессы + генерация слайдов, видео
— 80+ встроенных инструментов: CRM, задачи, API, документы
— Агент сам выбирает подходящий инструмент и переключается в процессе
— Интеллектуальный feedback-loop и динамическая оркестрация действий
— В бенчмарках Genspark часто обходит конкурентов по точности и эффективности

📌 Для индивидуальных пользователей и малых команд Genspark имеет явные приемущества: мощь, гибкость и доступность — без кода и без боли.
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sun, 20 Jul 2025 13:22:32 +0300
⚡️ 1.3 млн токенов/сек на H800 — новый рекорд для LLM-инференции

Команда Yiakwy-XPU показала, как эффективно запускать большие языковые модели (например, DeepSeek V3) на 13×8 H800 DGX SuperPod с помощью SGlang в разнесённой архитектуре (disaggregated serving):

📊 Что удалось достичь:
1.3M токенов/сек на входе (prefill)
20K токенов/сек на выходе (decode)
• До 80K токенов/сек суммарной производительности
• При 50–150 параллельных запросах — стабильный throughput до 55K токенов/сек

📌 Важные выводы:
• Префилл — главное узкое место (TTFT ↑ при длинных запросах и больших батчах)
• Оптимальное соотношение вход/выход — 4:1, а prefill/decode — 3:1
• Меньшие tp и chunked-prefill уменьшают задержки между токенами (ITL)
• В режиме смешанного сервинга (decode + prefill) — лучше использовать батчинг именно с chunk-prefill, иначе резко растёт latency

🔧 Бенчмарки: bench_one_batch_server.py, genai-bench, evalscope
🔥 Используемая модель: Yi-1.5 34B

📦 Полная статья и код

@machinelearning_interview
Подробнее
]]>
https://linkbaza.com/catalog/-1001713271750 Sat, 19 Jul 2025 14:01:59 +0300
Подробнее
]]>