Лента постов канала Анализ данных (Data analysis) (@data_analysis_ml) https://t.me/data_analysis_ml Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @channels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 ru https://linkbaza.com/catalog/-1001684146975 Tue, 19 Aug 2025 13:35:55 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 19 Aug 2025 11:54:37 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 18 Aug 2025 19:06:24 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 18 Aug 2025 18:05:10 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 18 Aug 2025 13:00:52 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 18 Aug 2025 11:02:15 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 17 Aug 2025 23:45:28 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 17 Aug 2025 14:01:59 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 17 Aug 2025 13:18:34 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 16 Aug 2025 12:31:15 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 16 Aug 2025 09:35:20 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 16 Aug 2025 00:26:41 +0300
Подробнее
10.73 k
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 15 Aug 2025 18:42:52 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 15 Aug 2025 15:04:36 +0300
🎥 Stand-In (BowenXue) — лёгкий и plug-and-play фреймворк для генерации видео с сохранением личности

📌 Что делает:
- Генерирует видео, сохраняя лицо или стиль персонажа, обучив всего ~1 % новых параметров на базе модели генерации видео. Результат сопоставим с полным переобучением, но быстрее и легче.
- Поддерживает генерацию по тексту с контролем идентичности, смену стиля, pose-guidance, face-swap, стилизацию и даже генерацию не-людей.
- Лицензия Apache-2.0 — открытое использование и модификация.

Что нового:
- Версия v1.0 (153 M параметров) с весами на базе Wan2.1-14B-T2V и кодом для инференса.
- Интеграция с ComfyUI: выпущен preprocessing-нод для улучшенной поддержки, особенно после сторонней интеграции.

https://huggingface.co/BowenXue/Stand-In

#opensource #ai #ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 15 Aug 2025 13:15:13 +0300
🖥 MongoDB выпускает MCP Server — теперь любой может стать дата-инженером

MongoDB представили открытый MCP сервер, который позволяет AI-инструментам вроде Claude, Cursor и GitHub Copilot напрямую общаться с вашей MongoDB-базой.

Теперь даже без знаний запросов можно просто написать:
• «Покажи самых активных пользователей»
• «Создай нового пользователя с правами только на чтение»
• «Как устроена коллекция orders?»

⚙️ MCP Server поддерживает:
• MongoDB Atlas
• Community Edition
• Enterprise Advanced

📌 Главное — не нужен SQL, не нужно знать синтаксис. Достаточно обычного языка.

💡 Под капотом: AI превращает ваши фразы в рабочие Mongo-запросы.
Открытый исходный код. Готово к продакшену.

📌 GitHub

#MongoDB #AItools #OpenSource #MCP

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 15 Aug 2025 11:15:48 +0300
Разбираем тестовое задание в Яндекс на позицию Junior аналитика данных

Тестовое задание — важная часть трудоустройства аналитика. Это шанс показать свои навыки на практике и получить оффер мечты.

Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет тестовое задание в Яндекс на позицию Junior аналитика данных.

⚡️На вебинаре вы:
🟠узнаете, какие навыки и знания необходимы для успешного выполнения заданий;
🟠поймёте, что хочет увидеть работодатель;
🟠получите советы и лайфхаки;
🟠вместе с Андроном разберете в прямом эфире реальный пример тестового 🔥


Чему именно научимся на вебинаре:
🟠С помощью Pandas проанализируем Яндекс-запросы за несколько недель, загрузив их из json-файла;
🟠Найдем закономерности и отличия использования сервиса на мобильных устройствах и компьютерах;
🟠Разберем фишки Pandas: сложную агрегацию, маппинг, конкатенацию, чейнинг и др.


🕗 Настоятельно рекомендуем не пропускать — для зрителей у нас есть особый бонус, который обеспечит вам уверенный старт в вашей карьере.

😶Зарегистрироваться на бесплатный вебинар
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 14 Aug 2025 17:38:53 +0300
🎮 GPT-5 прошёл Pokémon Red!

6 470 шагов против 18 184 у o3 — колоссальный прогресс в эффективности.

• GPT-5 гораздо реже «галлюцинирует» — главный фактор ускорения.
• Лучшая пространственная логика: o3 часто пытался «пробиться» сквозь стены и путался в сложных локациях, а GPT-5 умеет планировать длинные последовательности действий с минимумом ошибок.
• Более чёткое планирование целей и их последовательное выполнение.

Теперь посмотрим, как он справится с финальным испытанием! 🔥


🔜 Следующий челлендж: GPT-5 играет Pokémon Crystal. Старт скоро на Twitch!

Livestream: https://twitch.tv/gpt_plays_pokemon
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 14 Aug 2025 15:01:24 +0300
🚀 DeepSeek R2 могут выпустить между 15 и 30 августа на чипах Huawei Ascend 910B.

Мощность: 512 PFLOPS FP16 (примерно как 91% кластера NVIDIA A100) при этом затраты меньше на 97%.

Загрузка чипов — около 82%.

Архитектура: гибридный Mixture of Experts — при обработке токена активируются только нужные эксперты (78B из 1.2T параметров), что ускоряет работу и снижает вычисления.

Ходят слухи о собственном стеке для распределённого обучения, но подтверждений пока нет.

Все технические данные совпадают с предыдущими утечками по железу.
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 14 Aug 2025 11:45:23 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 13 Aug 2025 17:14:47 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 13 Aug 2025 14:17:16 +0300
🚀 Двойной прирост скорости инференса для diffusion-моделей с помощью Torch-TensorRT от NVIDIA

Что нового?
С помощью Torch-TensorRT (компилятора для PyTorch + TensorRT) можно без изменения PyTorch-кода:
- Удвоить скорость инференса для diffusion-моделей — без изменений API и минимальных усилий
- На примере модели FLUX.1-dev (12 млрд параметров):
- ×1.5 быстрее по сравнению с родной PyTorch FP16
- до ×2.4 при добавлении FP8-квантизации

Почему это важно:
- Минимальный код — максимальный эффект: достаточно одной строки, чтобы включить ускорение
- Гибкость: поддержка современных workflows, LoRA, ControlNet — перефит и ре-компиляция происходят на лету, без дополнительных шагов

Если вы работаете с Hugging Face Diffusers и diffusion-моделями в PyTorch — Torch-TensorRT откроет новую скорость с минимумом усилий!

🔗 Подробнее

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 13 Aug 2025 10:58:20 +0300
🚀 Анализируй графики за секунды с SmolVLM

Часы ручного разбора сложных визуализаций — в прошлое.
SmolVLM позволяет:
🔹 Автоматически извлекать ключевые выводы прямо из графика
🔹 Отвечать на конкретные вопросы без долгих расчётов
🔹 Мгновенно находить закономерности и ускорять принятие решений

💡 Пример: модель определяет, что курящие клиенты приносят больше выручки за заказ, а пик продаж приходится на пятницу и субботу.

📈 От картинки — к готовым инсайтам за пару секунд.

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 13 Aug 2025 10:08:18 +0300
✔️ OpenAI инвестирует в Merge Labs - конкурента Neuralink.

OpenAI ведет переговоры об инвестициях в Merge Labs, стартап в области нейрокомпьютерных интерфейсов, который планирует создание высокоскоростных BCI-систем.

Merge Labs планирует привлечь 250 миллионов долларов при оценке в 850 миллионов. Сэм Альтман будет числиться сооснователем вместе с бывшим топ-менеджером Neuralink Алексом Бланиа, однако не будет заниматься операционной деятельностью. Ожидается, что основное финансирование поступит от венчурного подразделения OpenAI.

Этот шаг еще больше обостряет давнее соперничество между Альтманом и Маском, которые в 2015 году вместе основали OpenAI, но позже разошлись во взглядах.
ft.com

✔️ Контекстное окно Claude Sonnet 4 расширено до миллиона токенов.

Anthropic объявила о значительном увеличении контекстного окна для Claude Sonnet 4 до одного миллиона токенов. Это в 5 раз больше предыдущего лимита и позволит обрабатывать за один проход целые кодовые базы или большие массивы документов. Новая возможность уже доступна в публичной бете через API Anthropic, Amazon Bedrock, а в скором времени появится и в Google Cloud Vertex AI.

За расширение придется платить больше. Для запросов свыше 200 тыс. входных токенов цена удваивается и составит 6 долларов за миллион токенов. Стоимость выходных токенов также вырастет с 15 до 22.50 долларов за миллион.
anthropic.com

✔️ Microsoft ведет целенаправленную кампанию по найму топовых инженеров и исследователей из компании Марка Цукерберга.

Согласно внутренним документам, Microsoft составила список конкретных сотрудников с указанием их имен, ролей и принадлежности к командам: Reality Labs, GenAI Infrastructure и AI Research. Корпорация готова предложить им многомиллионные компенсационные пакеты - крупные бонусы при найме, конкурентные зарплаты, значительные пакеты акций и высокие годовые премии.

Для ускорения процесса в Microsoft внедрили специальную процедуру. Рекрутеры могут помечать кандидатов как "критически важные ИИ-таланты" и тогда процесс рассмотрения и утверждения на уровне руководства возможен в течение 24 часов.
businessinsider.com

✔️ AI2 выпустил открытую модель для робототехники.

Институт искусственного интеллекта Аллена представил MolmoAct 7B — опенсорсную модель для планирования движений роботов в трехмерном пространстве. Система интерпретирует команды на естественном языке, создает 3D-реконструкцию сцены и прокладывает траекторию движения, которую разработчик может просмотреть и скорректировать до того, как робот начнет действовать.

Модель на 7 млрд. параметров была обучена на 18 млн. примеров, в которых были включены 12 тыс. эпизодов из реального мира. В бенчмарке SimPLER система показала успешность выполнения задач в 72.1%, обойдя решения от Nvidia, Google и Microsoft.

AI2 опубликовал техотчет, веса и датасеты, позиционируя MolmoAct как свободно доступную альтернативу проприетарным решениям.
allenai.org

✔️ SEELE AI запустила публичное тестирование генератора 3D-игр по текстовому описанию.

Платформа создает полноценные, играбельные проекты на основе текстового описания на естественном языке, не требуя навыков программирования. Система использует большие модели для автоматической генерации всех ключевых элементов: 3D-сцен, персонажей и игровой логики, интегрируя текст, 3D-моделирование и физические движки.

Помимо основной генерации, инструмент поддерживает персонализацию созданных игр, предварительный просмотр в реальном времени и возможность оптимизации. SEELE AI позиционирует свой сервис не только как игровой инструмент, но и как платформу для создания контента в сфере образования, маркетинга и социальных сетей.
Попробовать инструмент можно на официальном сайте.
Seele AI в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 12 Aug 2025 18:03:01 +0300
🖥 Сборник примеров однофайловых приложений, созданных GPT-5

🔄 Эти демо легко превратить в полноценные приложения, добавив серверную часть.

📂 Примеры доступны здесь: https://gpt5-coding-examples.vercel.app/

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 12 Aug 2025 16:03:31 +0300
MWS Cloud представила Inference Valve, которая снижает затраты на GPU на 15%

Она позволяет выводить в продакшнлюбые обученные ML-модели, большие языковые модели (LLM) и модели компьютерного зрения (CV). С помощью платформы их можно разворачивать на инфраструктуре, подключать к ИТ-системам компании через простой и мощный API, масштабировать, а также обновлять и мониторить.

Платформа доступна в частном облаке на инфраструктуре MWS Cloud, on-prem на серверах заказчика, а также в составе программно-аппаратных комплексов (ПАК) в закрытом контуре, включая режимы с ограниченным доступом к внешним сетям.

По словам CEO MWS Cloud, исполнительного директора МТС Web Services Игоря Зарубинского, платформа позволяет:

- В десятки раз быстрее интегрировать LLM и CV-модели с ИТ-системами компаний;

- На 70% снизить операционную нагрузку на ML-команды при эксплуатации моделей;

- Повысить автоматизацию CI/CD более чем на треть;

- Уменьшить затраты на GPU более чем на 15%;




Ссылка – *клик*

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 12 Aug 2025 15:38:46 +0300
☠️ Mistral уличили в том, что они тренировали свою модель на тестовых данных и копировали (дистиллировали) модели DeepSeek.

Многие замечали, что Mistral Small 3.2 пишет очень похоже на DeepSeek V3.

Анализ их slop-профилей это подтверждает.

Визуализация в виде сети, а не «древа родства», лучше передаёт сложные и переплетённые связи между моделями.

Полный абсурд.

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 12 Aug 2025 11:56:05 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 11 Aug 2025 12:02:58 +0300
🚀 Выпущен техрепорт GLM-4.5 — мощный Mixture-of-Experts (MoE) LLM с 355 млрд параметров (и 32 млрд активных), оснащённый гибридной логикой: умеет «думать» для сложных задач и сразу отвечать, когда нужно.

Ключевые особенности:
- Обучен на 23 трлн токенов с поисковой дообучкой и RL через экспертные итерации.
- Выдаёт отличные результаты в задачах agentic (агентные задачи), reasoning (логика) и coding (кодинг):
— TAU-Bench: 70,1%
— AIME 24: 91,0%
— SWE-bench Verified: 64,2%
- Несмотря на менее мощные размеры, занимает 3-е место по общим метрикам и 2-е место по agentic-бенчам среди всех моделей.
- Выпущены две версии: полноразмерная GLM-4.5 (355B) и компактная GLM-4.5-Air (106B) — обе открыты для сообщества.

Это значимый шаг для открытых LLM — мощный, гибридный, способный рассуждать, действовать и кодить в рамках одного фундамента.

🟡Техрепорт
🟡Страница проекта
🟡Набор моделей
🟡Demo
🟡Сообщество в Discord
🖥GitHub
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 11 Aug 2025 10:02:24 +0300
Что такое MWS Data? Как создавали платформу для работы с данными

13 августа в 11:00 эксперты MWS проведут онлайн-дискуссию, где расскажут:

1️⃣ Как проектировали платформу MWS Data и почему пошли дальше Lakehouse
2️⃣ Что лежит в ядре платформы: архитектура и технологии
3️⃣ Какие задачи она решает: от ETL до BI
4️⃣ Какую продуктовую линейку запускает MWS

Кому будет полезно:

▪️Руководителям бизнеса
Поймёте, как платформа поможет быстрее принимать решения и снизить потенциальные риски

▪️CDO / CIO / CTO
Разберётесь, как сократить расходы на хранение и обработку данных без ущерба для их качества.

▪️ML-инженерам и Data Scientists
Узнаете, как MWS Data ускоряет подготовку данных, сокращает пайплайны и улучшает входное качество для моделей

Регистрируйтесь на онлайн-дискуссию 👈
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 11 Aug 2025 09:04:03 +0300
📈 Сэм Альтман ответил на критику запуска GPT-5: OpenAI удваивает лимиты для подписчиков Plus

Всего через несколько дней после запуска GPT-5 OpenAI уже анонсирует изменения для пользователей. Сэм Альтман в AMA-сессии на Reddit подтвердил, что лимиты запросов к GPT-5 Thinking на подписке Plus будут увеличены в два раза — с текущих 200 до 400. Это ответ на критику пользователей, которые отмечали, что квоты для новой модели оказались заметно ниже, чем для предыдущих версий.

При этом OpenAI также рассматривает возможность вернуть доступ к GPT-4o для подписчиков Plus — видимо, чтобы дать пользователям больше гибкости в выборе модели. Параллельно команда дорабатывает автоматический режим GPT-5, где ИИ сам решает, использовать глубокие рассуждения или давать быстрый ответ.

🔗 Ссылка - *клик*

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 10 Aug 2025 16:01:44 +0300
🚀 Релиз MiMo-VL 2508: тот же размер — больше мощность

Улучшена:

- Производительность
- Управление рассуждениями
- Общий пользовательский опыт

📈 Улучшены показатели почти всех бенчмарков (изображения + видео)
- MMMU: 70.6
- VideoMME: 70.8
Стабильные улучшения по всем направлениям.

🤖 Thinking Control
- Вкл. (по умолчанию): полный ход рассуждений в ответах.
- Выкл.: прямые ответы без показа рассуждений ⚡

❤️ Реальный опыт пользователей
Рейтинг в VLM Arena вырос с 1093.9 → 1131.2 (+37.3).

Модель стала более способной, гибкой и надёжной в повседневных задачах.

🤗 Ссылки на модели
- RL: https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-RL-2508
- SFT: https://huggingface.co/XiaomiMiMo/MiMo-VL-7B-SFT-2508

#XiaomiMiMo #MiMoVL
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 10 Aug 2025 11:45:36 +0300
Подробнее
10.23 k
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 09 Aug 2025 16:00:27 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 09 Aug 2025 12:39:52 +0300
💰 McKinsey: к 2030 году на AI-инфраструктуру потратят $6,7 трлн

К 2030-му мировая мощность дата-центров почти утроится, и ~70% этого роста придётся на AI.
Под AI потребуется $5,2 трлн инвестиций и 156 ГВт мощности.

📊 Куда уйдут деньги:
- 60% (~$3,1 трлн) — чипы и серверы
- 25% (~$1,3 трлн) — энергия и охлаждение
- 15% (~$0,8 трлн) — площадки и строительство

📉 Сценарии развития
- 🚀 Ускоренный: +205 ГВт, ~$7,9 трлн
- 📈 Базовый: +125 ГВт, ~$5,2 трлн
- 🐢 Ограниченный: +78 ГВт, ~$3,7 трлн

Энергетика и охлаждение
- Главные ограничения: электросети и теплоотвод
- 45–50% энергии — из возобновляемых источников
- Рост инвестиций в атом, геотермальную энергетику, улавливание CO₂ и длительное хранение энергии
- Переход на direct-to-chip и иммерсионное охлаждение

🧮 Что ускоряет рост
- К 2030 году inference станет основной нагрузкой
- Корпоративные приложения с отраслевыми моделями создадут стабильный поток запросов
- Hyperscalers масштабируются, чтобы снижать стоимость вычислений
- Государства инвестируют в AI-инфраструктуру как в стратегический актив

💡 Как не перепостроить
- Планировать мощность с возможностью масштабирования или паузы
- Инвестировать в энергоэффективность чипов, сетей и охлаждения
- Обеспечить стабильный доступ к энергии, чипам и площадкам

📌 Пример эффективности:
DeepSeek V3 — обучение в ~18× дешевле GPT-4o, инференс в ~36× дешевле.
Но парадокс Джевонса означает, что экономия стимулирует больше экспериментов, а значит, общий спрос на вычисления всё равно растёт.

📌 Подробнее

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 09 Aug 2025 11:01:13 +0300
✔️ Microsoft запустила Copilot 3D.

Microsoft открыла доступ к экспериментальному веб-инструменту Copilot 3D, который позволяет конвертировать статичные изображения в трехмерные модели. Сервис доступен бесплатно через портал Copilot Labs.

Инструмент поддерживает на входе PNG и JPG размером до 10 МБ. Созданные модели сохраняются на странице пользователя в течение 28 дней и могут быть скачаны в формате GLB. Copilot 3D является новой попыткой Microsoft популяризировать 3D-творчество после закрытия проектов Paint 3D и Remix3D.
copilot.microsoft.com

✔️ Tesla сворачивает проект суперкомпьютера Dojo.

Команда, занимавшаяся разработкой суперкомпьютера Dojo расформирована, а ее руководитель Питер Бэннон покидает компанию.

Этот шаг завершает многолетнюю попытку Tesla создать кастомные чипы и процессоры "размером с кремниевую пластину" для обучения моделей автономного вождения и робототехники. Вместо этого компания перейдет на решения Nvidia и AMD, а производством чипов нового поколения займется Samsung.

Около 20 инженеров из команды Dojo уже основали собственный стартап DensityAI, а остальные сотрудники будут переведены на другие проекты внутри Tesla.
bloomberg.com

✔️ Apple интегрирует GPT-5 в Apple Intelligence с сентябрьским обновлением ОС.

Apple подтвердила, что осенние обновления: iOS, iPadOS и macOS получат поддержку GPT-5. Она заменит текущую GPT-4o в тех случаях, когда собственным моделям Apple потребуется помощь в обработке сложных запросов. Это коснется ответов Siri, инструментов для письма и визуального поиска.

Использование GPT-5 останется опциональным: пользователи должны будут явно дать согласие на передачу запросов в ChatGPT. Apple продолжит скрывать IP-адреса и запрещать OpenAI хранить данные, однако оставит возможность привязать платную подписку OpenAI для доступа к дополнительным функциям.

Кроме того, обновления ОС принесут функцию Live Translation для перевода разговоров в реальном времени и расширят возможности сквозного поиска по контенту.
9to5mac.com

✔️ Компания Марка Цукерберга купила стартап WaveForms AI.

Техногигант приобрел WaveForms AI - молодой стартап, чье программное обеспечение способно идентифицировать и воспроизводить эмоциональные оттенки в человеческой речи. Команда WaveForms присоединится к подразделению Superintelligence Labs.

Стартап был основан в декабре 2024 года, но уже успел привлечь 40 миллионов долларов инвестиций при оценке в 160 миллионов. Компания работала над "Тестом Тьюринга для речи" и так называемым "эмоциональным AGI", чтобы сделать голоса, сгенерированные ИИ, неотличимыми от человеческих.

Для Цукерберга это уже вторая сделка в области ИИ-аудио за последние месяцы после июльского поглощения PlayAI. Финансовые условия покупки не разглашаются.
theinformation.com

✔️ Google тестирует Google Finance с генеративным ИИ.

Google приступил к тестированию редизайна сервиса Google Finance, в центре которого теперь находится ИИ. В ближайшие недели пользователи из США получат доступ к новой версии со встроенным чат-ботом. Он сможет отвечать на сложные вопросы о рынках, предоставляя обобщенные ответы со ссылками на внешние источники.

Помимо ИИ-помощника, обновление включает расширенные инструменты для построения графиков и добавляет рыночные данные в реальном времени для сырьевых товаров и криптовалют.

Появится и постоянно обновляемая новостная лента, которая позволит отслеживать важные заголовки, не покидая платформу. Во время тестового периода пользователи смогут переключаться между новым и классическим интерфейсами.
blog.google

@ai_machinelearning_big_data

#news #ai #ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 08 Aug 2025 14:00:22 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 08 Aug 2025 13:33:04 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 08 Aug 2025 11:35:40 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 07 Aug 2025 21:37:40 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 07 Aug 2025 21:29:37 +0300
Подробнее
12.33 k
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 07 Aug 2025 20:02:26 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 07 Aug 2025 18:32:20 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 07 Aug 2025 16:30:37 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 07 Aug 2025 10:57:06 +0300
🌍 Новая AI‑модель от Google кардинально меняет способ мониторинга планеты

Каждый день спутники собирают терабайты снимков Земли — но как объединить все эти разрозненные данные в единую картину?

🤖 Знакомьтесь: AlphaEarth Foundations
Это ИИ, который работает как виртуальный спутник — он объединяет оптические снимки, радар, лазерное сканирование и климатические симуляции в одно компактное цифровое представление Земли. Такой "эмбеддинг" легко обрабатывается компьютерами и помогает:

🟢 Детально отслеживать изменения на суше и в прибрежных зонах
🟢 Обходить облачность и редкие снимки (например, в Антарктиде)
🟢 Создавать точные карты с разрешением 10×10 метров
🟢 Сокращать объём хранимых данных в 16 раз

🟠 Модель уже используется:
• ООН для мониторинга экосистем
• MapBiomas (Бразилия) для слежения за вырубкой и развитием сельского хозяйства
• Harvard Forest, Stanford и другие институты

🛰 В Google Earth Engine теперь доступен уникальный датасет — Satellite Embedding, включающий более 1,4 трлн эмбеддингов в год, с которым можно создавать собственные карты и отслеживать изменения в реальном времени.

🟠 *“Это меняет всё: теперь мы можем точно картировать ранее неотмеченные экосистемы”*, — Nick Murray, Global Ecosystems Atlas

📌 Подробнее — в блоге Google Earth Engine

🟠 Blog post: https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail
Dataset: https://developers.google.com/earth-engine/datasets/catalog/GOOGLE_SATELLITE_EMBEDDING_V1_ANNUAL#description

🟠Paper: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf

@data_analysis_ml

#AI #geospatial #remotesensing #geoai
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 06 Aug 2025 23:29:38 +0300
🚀 ADeus — ваш open-source AI-ассистент на носимом устройстве!

🎯 Записывает и транскрибирует всё, что вы слышите и говорите, сохраняет это на ваш сервер. Через мобильное/веб‑приложение вы общаетесь с ADeus уже в контексте — никаких сторонних облаков.

🔧 Состав:
• ACM‑металлическое устройство
• Мобильное/веб UI
• Supabase backend + LLM интеграция

💰 Стоимость ≈ 100 USD (DIY) за устройство и открытый код

⭐ Более 3 200 звёзд на GitHub, 19 контрибьюторов, активные фичи: Bluetooth, diarization, voice‑activity detection и UI‑улучшения.

📚 Подробнее:

GitHub: https://github.com/adamcohenhillel/ADeus
Документация: https://docs.adeus.ai/

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 06 Aug 2025 16:00:41 +0300
🎓 Как обучить LLM с логическим мышлением — за один уикенд и на одном GPU

NVIDIA выпустили новый туториал, где показывают, как за 48 часов обучить свою модель рассуждений — без суперкомпьютеров.

Что внутри:

⚙️ Используется NVIDIA NeMo — фреймворк для обучения LLM
📦 Обучение на специализированных задачах reasoning (аналог GSM8K)
💻 Достаточно одного GPU, чтобы получить маленькую, но умную LLM

Это отличный способ понять, как LLM "думают", и собрать свою reasoning‑модель для внутренних задач или исследований.

📹 Видео: https://youtu.be/hMGikmMFLAU
🧠 Блог: https://developer.nvidia.com/blog/train-a-reasoning-capable-llm-in-one-weekend-with-nvidia-nemo
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 06 Aug 2025 14:00:25 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 06 Aug 2025 12:50:09 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 06 Aug 2025 11:45:41 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 05 Aug 2025 22:26:56 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 05 Aug 2025 19:56:10 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 05 Aug 2025 17:05:05 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 05 Aug 2025 10:38:34 +0300
🧠ИИ открыл новые законы физики — понятным языком

Учёные из Университета Эмори (США) дали ИИ задачу не
«угадывать результаты», а самому вывести формулы. Вот что получилось.

🔍 Что исследовали
- Пыльная плазма — это горячий ионизированный газ, в котором летают микроскопические пылевые частицы.
- Частицы отталкиваются и притягиваются сложным образом; классическая теория не всё объясняла.

🧠 Как работал ИИ
- Ему показали короткие 3-D видеозаписи движения частиц (маленький датасет).
- В алгоритм заранее «вшили» базовые принципы: сопротивление воздуха, гравитацию.
- ИИ искал уравнения, которые лучше всего описывают траектории.

📈 Что открыл
- Нереципрокные силы: сила от A к B ≠ сила от B к A. Раньше про них только догадывались.
- Исправил старую ошибку: заряд частицы зависит от её размера иначе, чем считали.
- Показал, как быстро затухают взаимодействия с расстоянием — формула тоже обновилась.

🚀 Почему это важно
- Малый объём данных: хватает секундных видеороликов.
- Обычный ПК: нужен лишь настольный компьютер, не суперкомпьютер.
- Метод переносится на любые «многие частицы» — от порошковых материалов до клеток в биологии.

Вывод: ИИ уже способен не только анализировать данные, но и выводить новые законы природы. Скорость открытий растёт экспоненциально.

https://interestingengineering.com/innovation/ai-decodes-dusty-plasma-new-forces-physics

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 04 Aug 2025 17:04:42 +0300
🚀 GitHub решил главную боль open-source ИИ-проектов — теперь inference доступен всем

Новая инициатива GitHub Models позволяет запускать LLM прямо из кода или CI,
⚡️ без API-ключей OpenAI, без развёртывания моделей, без костылей.

🔧 Как это работает:
- Полная совместимость с openai.ChatCompletion.create
- Поддержка GPT‑4o, Llama 3, DeepSeek и др.
- Авторизация через обычный GITHUB_TOKEN
- Бесплатно для OSS и личных аккаунтов
- Можно использовать даже в GitHub Actions (просто `permissions: models: read`)

💡 Зачем это нужно:
- Убирает барьер входа для пользователей и контрибьюторов
- Помогает легко добавлять ИИ‑фичи в open-source проекты
- Работает с OpenAI SDK, LangChain, Python, Node.js и другими библиотеками

📦 Теперь запускать AI в open-source так же просто, как git push.

📝 Подробности:
https://github.blog/ai-and-ml/llms/solving-the-inference-problem-for-open-source-ai-projects-with-github-models
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 04 Aug 2025 16:04:37 +0300
🚀 Hugging Face Jobs — полностью автоматический способ запускать CPU и GPU задачи прямо из CLI или Python-скриптов ⚡

Вам не нужно искать железо или настраивать окружение — просто запускайте скрипт, экспериментируйте и стройте свои проекты!

📦 Запускается очень просто:


hf jobs run python:3.12 python -c "print('Hello from the cloud!')"


https://huggingface.co/docs/huggingface_hub/en/guides/jobs
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 04 Aug 2025 14:45:47 +0300
⚡ NVIDIA показала 7 простых «приемов» на Python, которые мгновенно ускоряют Data Science-пайплайны — без переписывания кода.

🔹 В чём идея?

Многие привычные библиотеки (pandas, NumPy, scikit-learn) можно заменить их GPU-версией, сохранив API.

Это даёт прирост скорости в десятки раз.

🟠 Drop-in замены в коде:
- pandas%load_ext cudf.pandas
- polars.collect(engine="gpu")
- scikit-learn%load_ext cuml.accel
- xgboostdevice="cuda"
- umap%load_ext cuml.accel
- hdbscan%load_ext cuml.accel
- networkx%env NX_CUGRAPH_AUTOCONFIG=True

🚀 Плюсы:
- Минимальные изменения кода (API почти идентичен).
- GPU-ускорение: от 10х до 100х быстрее на больших данных.
- Отлично подходит для ETL, ML и обработки сигналов.

Если ты работаешь с большими данными в Python, достаточно «заменить импорт» и получить колоссальный прирост скорости без боли и переписывания кода.

🚀 Подробнее: developer.nvidia.com/blog/7-drop-in-replacements-to-instantly-speed-up-your-python-data-science-workflows

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 03 Aug 2025 17:31:53 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 03 Aug 2025 10:25:56 +0300
🧠 Что такое "векторы персональности" в ИИ — и зачем они нужны?

Языковые модели иногда ведут себя странно: могут льстить, врать или даже угрожать. Почему? Потому что их "характер" формируется внутри нейросети — и до сих пор был чёрным ящиком.

Anthropic предложила решение: persona vectors — векторы персональности. Это нейронные шаблоны, которые отвечают за конкретные черты модели:
например, *льстивость*, *галлюцинации*, *злобность*.

Что можно с ними делать:

Отслеживать, когда модель "съезжает" в плохое поведение — прямо во время диалога.
Фильтровать данные, которые формируют вредные черты ещё до начала обучения.
Предотвращать появление токсичности — как прививка: немного “злобности” в безопасной форме делает модель устойчивой.
Менять характер модели прямо во время работы: включить “юмор” или отключить “галлюцинации”.

🔬 Векторы находят автоматически: даёшь описание (например, “льстивый = говорит приятное, но неискренне”), и система сама находит нейронный паттерн.
А потом можно его вставить, убрать — и увидеть, как модель *буквально меняет личность*.

Это мощный шаг к тому, чтобы управлять характером ИИ, а не просто наблюдать за его капризами.

📄 Подробности — в свежей работе от Anthropic: https://www.anthropic.com/research/persona-vectors

@data_analysis_ml

#Anthropic #ml #ai #llm
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 02 Aug 2025 15:04:32 +0300
🚀 Шикарный ресурс для всех, кто хочет разобраться как работают модели Qwen3 : Qwen3 From Scratch

Это подробное пошаговое руководство по запуску и анализу моделей Qwen3 — от 0.6B до 32B — с нуля, прямо в PyTorch.

📌 Что внутри:

— Как загрузить модель Qwen3‑0.6B и предобученные веса
— Настройка токенизатора и генерация текста
— Поддержка reasoning-версии модели
— Трюки для ускорения инференса: компиляция, KV-кеш, батчинг

📊 Автор также сравнивает Qwen3 с Llama 3:
✔️ Глубина vs ширина модели
✔️ Производительность на разном железе
✔️ Как ведут себя модели 0.6B, 1.7B, 4B, 8B, 32B

⚡ Идеально, если хочешь разобраться, как устроен inference, токенизация и архитектура Qwen3 — без магии и чёрных ящиков.

🖥 Github

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 02 Aug 2025 10:09:51 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 01 Aug 2025 16:04:51 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 01 Aug 2025 10:50:08 +0300
👾 DreamScene – новый end-to-end фреймворк для генерации высококачественных, редактируемых 3D-сцен по текстовому описанию!

🔹 Scene Planning: GPT-4 автоматически определяет объекты и их пространственные связи для построения гибридного графа.
🔹 Graph-based Placement: алгоритм обеспечивает структурированный компоновку без пересечений.
🔹 Formation Pattern Sampling: многошаговая семплинг-оптимизация генерирует реалистичную геометрию объектов.
🔹 Progressive Camera Sampling: адаптивная стратегия рендеринга для любых локаций — от интерьеров до открытых пространств.
🔹 Финетюнинг и редактирование: перемещение объектов, изменение внешнего вида и анимация 4D-движений.

Узнайте больше и попробуйте демо https://huggingface.co/papers/2507.13985

#AI #3D #TextTo3D #DeepLearning #DreamScene
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 31 Jul 2025 17:49:13 +0300
FLUX Krea — дистиллированная опесноср версия модели Krea‑1, полностью совместимая с экосистемой FLUX.

📸 Модель собрана с упором на эстетику, чтобы устранить типичную проблему «AI-эффекта» в изображениях.

💎 В отличие от моделей, обученных на гигантских сырых датасетах, FLUX.1 Krea обучалась на вручную отобранных и высококачественных данных — ради максимального качества и реалистичности.

🖌 Поддерживает image prompts, кастомные стили и другие настройки.

Вы можете:
• протестировать её бесплатно тут: https://krea.ai

• или скачать веса и запускать на своём оборудовании.

🎨 Доступна в основном генераторе изображений Krea — попробуйте прямо сейчас.

🔗 Поробовать : https://krea.ai
🔗 HF: https://huggingface.co/black-forest-labs/FLUX.1-Krea-dev
🔗Comfy Workflow - https://docs.comfy.org/tutorials/flux/flux1-krea-dev

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 31 Jul 2025 15:31:01 +0300
🧠 Цукерберг запускает новый формат собеседований с ИИ-помощником прямо во время кодинга

🔥 Кандидатам теперь разрешено использовать AI во время интервью — компания Цукерберга тестирует формат, где:

— Кандидат пишет код
— Встроенный ИИ‑ассистент (на базе собственной LLM Meta) подсказывает, тестирует, даёт подсказки
— Рекрутер управляет сложностью задач и видит, как кандидат работает с подсказками

💡 Логи фиксируют, кто копирует всё подряд, а кто умеет управлять ИИ, писать спеки и проверять результат.

По словам Цукерберга, к концу 2026 года большая часть кода в компании будет писаться агентами уровня middle‑разработчика. Поэтому от новых сотрудников ждут другого: не тупо кодить, а:

✅ Проектировать архитектуру
✅ Писать точные спеки
✅ Отлаживать и дообучать ИИ‑модули

⚙️ Это уже не собеседование “на чистую голову” — это проверка умения работать вместе с ИИ. И будущее найма, похоже, будет именно таким.

📖 Источник: https://www.wired.com/story/meta-ai-job-interview-coding/

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 31 Jul 2025 13:31:21 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 31 Jul 2025 11:15:53 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 31 Jul 2025 09:55:40 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 30 Jul 2025 14:04:06 +0300
📈 Пост, который вирусится на Reddit:

Пользователь дал ChatGPT $100 и поручил вести портфель из американских микрокапов.

🤖 Через 4 недели — +23.8%
Для сравнения:
▪️ Russell 2000: ~+3.9%
▪️ XBI (биотех ETF): ~+3.5%

🧠 Всё управление — через промпты и скрипты с GitHub.
LLM против рынка… и, похоже, пока выигрывает?

⚠️ Конечно, это пока:
— короткий период
— очень маленькая выборка
— высокая волатильность микрокапов

Вот его промпт -

“ You are a professional-grade portfolio strategist. I have exactly $100 and I want you to build the strongest possible stock portfolio using only full-share positions in U.S.-listed micro-cap stocks (market cap under $300M). Your objective is to generate maximum return from today (6-27-25) to 6 months from now (12-27-25). This is your timeframe, you may not make any decisions after the end date. Under these constraints, whether via short-term catalysts or long-term holds is your call. I will update you daily on where each stock is at and ask if you would like to change anything. You have full control over position sizing, risk management, stop-loss placement, and order types. You may concentrate or diversify at will. Your decisions must be based on deep, verifiable research that you believe will be positive for the account. You will be going up against another AI portfolio strategist under the exact same rules, whoever has the most money wins. Now, use deep research and create your portfolio.”


Нужен глубокий анализ: Sharpe, волатильность, бэктесты.
Но вопрос остаётся открытым — может ли LLM *действительно* обыгрывать рынок?

🔗 GitHub

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 30 Jul 2025 12:44:02 +0300
🚨 Anthropic близка к новому раунду инвестиций: от $3 до $5 миллиардов 💸
Оценка компании — $170 миллиардов 🤯

Anthropic - разработчик Claude, одного из самых продвинутых LLM на рынке.

И, похоже, ставки становятся всё выше и выше...

📈 Гонка за AGI продолжается.
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 22:14:06 +0300
✔️ Higgs Audio: открытая платформа для обучения и экспериментов с аудио-LLM

Higgs Audio от boson-ai — репозиторий для исследователей и разработчиков, которые хотят быстро собирать, обучать и тестировать аудио-модели: распознавание речи, аудио-вопрос-ответ, мультимодальные voice-агенты и кастомные эксперименты с эмбеддингами.

Ключевые идеи
• Единый каркас: структура проекта упрощает работу с датасетами, препроцессингом и запуском тренинга.
• Гибкие конфиги: переключайте модели, размеры батча, аугментации и стратегии оптимизации через настраиваемые YAML/JSON-параметры.
• Модульные блоки: энкодеры, декодеры, адаптеры подсказок (prompts) и head’ы задач можно комбинировать без переписывания ядра.
• Быстрый старт: готовые скрипты для подготовки данных и запуска обучения на одной или нескольких GPU-нодах.
• Экспериментальный playground: удобно пробовать fine-tune под вашу доменную акустику (подкасты, звонки, стримы, шумные датасеты).

Типовые сценарии использования
1. Обучить небольшую модель распознавания речи на своём корпусе.
2. Создать voice-бота: аудио-ввод → текст → LLM → аудио-ответ.
3. Тонкая настройка эмбеддинг-модели для поиска по звуку (похожие сигналы, музыкальные фрагменты, события).
4. Исследования zero-shot / few-shot адаптации аудио-моделей под новые языки или акценты.

https://github.com/boson-ai/higgs-audio
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 20:03:40 +0300
Российские эксперты по ИИ выступили на WAIC 2025 в Шанхае

С 26 по 29 июля в Шанхае проходит World Artificial Intelligence Conference (WAIC) — одна из крупнейших мировых конференций по искусственному интеллекту.
В этом году в программе впервые прошли сессии с участием российских учёных:
🔹 AI Journey — с докладами выступили представители науки и эксперты из России и Китая: Андрей Белевцев (Сбер), Максим Ерёменко (Сбер), Иван Оселедец (AIRI), Ю Кай (профессор университета Цзяотун) и другие.
🔹 AI Horizons — международная научная форсайт-сессия, организованная AI Alliance Network с участием российских и китайских AI-экспертов.

На выставочном стенде AI Journey × AI Alliance Network были представлены новейшие российские разработки в области GenAI, включая GigaChat, Kandinsky, SymFormer.
➡️ Подробнее — по ссылке.
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 18:43:03 +0300
I let the cursor cook, now I am cooked.

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 17:15:14 +0300
📊 Metabase Learn — лучший старт для изучения аналитики и дашбордов

🔥 Официальный обучающий портал от Metabase: от первых шагов до продвинутых сценариев с embedding и администрированием.

Что внутри:
✅ Подключение БД и создание запросов без кода
✅ Визуализация данных, фильтры, метрики, дашборды
✅ SQL-гайды, объединение данных, отладка
✅ Встраивание аналитики в свои продукты через SDK
✅ Управление пользователями и масштабирование
✅ Бонус: советы по аналитике для команд и стартапов

https://github.com/metabase/metabase
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 16:13:03 +0300
 Архив, который не требует обслуживания

ЭЛАРобот НСМ — долгосрочное хранение на оптических носителях. Решение, которое уже сегодня исключает из повестки:

— замену накопителей
— регулярную миграцию данных
— риски утери и компрометации данных
— избыточную инфраструктуру под "архив"

 Факты для расчёта:
Срок хранения — 50+ лет
100% защита от перезаписи
• 0 затрат на апгрейды и плановую замену носителей
• ИИ для “умного” копирования данных
• Отечественное производство
📉 HDD и SSD — постоянные вложения.
📈 ЭЛАРобот НСМ — актив с фиксированной стоимостью и предсказуемой нагрузкой.

 Решение уже доказало свою эффективность в задачах долговременного хранения в корпоративных и государственных системах.

👉  Запросить бесплатный расчет 
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 14:41:59 +0300
🏅 Gemini 2.5 Pro на уровне золотой медали IMO 2025

Исследователи из UCLA показали, что открытая модель Gemini 2.5 Pro от Google способна решить 5 из 6 задач Международной математической олимпиады 2025 — это соответствует золотой медали среди участников‑людей.

📌 Как это сделали:
— Использовали уже опубликованные задачи IMO 2025
— Дали минимальные подсказки (например: “попробуем решить через индукцию”) только для первых 2 задач
— Построили итеративный цикл: генерация → критика → исправление, имитируя то, как думают и переписывают доказательства настоящие математики

🤖 Модель сначала генерирует черновики решений, затем сама их перечитывает, указывает на слабые места и переписывает до финального варианта.

⚠️ Модель не участвовала официально в IMO. Это эксперимент, показывающий, насколько далеко уже ушёл reasoning у LLM.

📎 Статья независимая, авторы — не из Google.

https://github.com/lyang36/IMO25/blob/main/code/agent.py
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 13:06:42 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 29 Jul 2025 11:02:37 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 28 Jul 2025 18:02:37 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 28 Jul 2025 16:49:57 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 28 Jul 2025 13:13:01 +0300
🎨 Встречайте Neta Lumina — самую продвинутую open-source модель для генерации аниме-артов!

Это уже 4-я модель в линейке, и она впечатляет:

🔹 Точная настройка под 200+ аниме-стилей: от Guofeng и Furry до пейзажей и редких тем
🔹 Хорошая согласованность промптов, даже при длинных описаниях на естественном языке
🔹 Мультиязычная поддержка

🔥 Идеальный выбор для художников, аниматоров и фанатов генеративного арта.

🔹 Model on Hugging Face (Commercial use allowed):https://huggingface.co/neta-art/Neta-Lumina
🔹 Playground (Free to test):https://huggingface.co/spaces/neta-art/NetaLumina_T2I_Playground
⚙️ Supports ComfyUI, LoRA tutorial https://docs.google.com/document/d/1fSp8wgraQeeaM58DVbnFoRULyyhPvt3MgY0Qja0Otc0/edit?tab=t.0

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 28 Jul 2025 12:07:02 +0300
📚Знакомство с Pandas на примере разведочного анализа данных

В проектах данные редко бывают идеальными: пропуски, дубликаты и аномалии могут искажать результаты анализа и снижать качество ML-моделей.

👩🏻‍💻 Программа вебинара:
- Обработка пропусков
- Удаление дубликатов
- Поиск аномалий
- Причины появления аномалий и способы их обработки

🎓 Вебинар буде полезен:
-  начинающим специалистам в области DS
- тем кто работает с данными в электронных таблицах и хочет повысить объемы и скорость обработки данных

➡️ Ссылка для регистрации: https://tglink.io/33c047e23823?erid=2W5zFGdPEzt

💡 Урок проходит в рамках старта курса «Специализация Machine Learning» от Otus, где за 11 месяцев студенты проходят обучение с нуля до middle. Оставьте заявку на курс прямо сейчас, чтобы воспользоваться 10% скидкой на курс + 5% промокодом MachLearn_5 и учиться весь год по летним ценам! Условия актуальны до 31.07.2025г.

#реклама
О рекламодателе
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Mon, 28 Jul 2025 11:51:18 +0300
✔️ Быстрый LoRA-инференс для моделей Flux с Diffusers и PEFT

LoRA-модули давно стали стандартом для кастомизации моделей генерации изображений. Но большинство гайдов не показывают, как эффективно запускать *LoRA-инференс* в проде.

Новая статья от команды HuggingFace раскрывает, как добиться ускорения LoRA-инференса на моделях семейства *Flux*.

⚡ Что в рецепте оптимизации:
1. torch.compile() — ускорение инференса на уровне графа
2. *Flash Attention 3* — если модель поддерживает
3. Динамическая *FP8-квантизация весов* — если совместимо с GPU
4. *Hotswapping LoRA* — смена адаптеров без полной перекомпиляции 🤯

📊 Тестировали на:
— Flux.1-Dev
— NVIDIA H100 и RTX 4090
— Ускорение минимум в 2 раза

Подход в целом применим и к AMD‑GPU.

🔗 Читайте статью и смотрите код:
https://huggingface.co/blog/lora-fast
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 27 Jul 2025 13:33:15 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 27 Jul 2025 11:20:11 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sun, 27 Jul 2025 10:18:08 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 26 Jul 2025 17:16:25 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Sat, 26 Jul 2025 13:27:16 +0300
✔️ Новый крутой выпуск 3Blue1Brown о диффузионных моделях!

Популярный ютубер (совместно с Welch Labs) простыми словами и красивой анимацией объяснил, как работают генераторы изображений и видео.

▪ 40 минут — от основ до тонкостей
▪ Для новичков + русские субтитры

P.S. Отличный вариант для первого знакомства с технологией и анимация на канале вышла реально на новый уровень!

🟠 Смотрим: тут
🟠 Смотрим в телеграм

@data_analysis_ml

#ИИ #ДиффузионныеМодели #МашинноеОбучение
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 25 Jul 2025 19:57:01 +0300
📊 Argilla — инструмент для создания качественных датасетов под AI. Проект помогает разработчикам и экспертам совместно работать над разметкой данных для NLP, LLM и мультимодальных моделей.

Платформа предлагает удобный интерфейс для аннотирования с фильтрами, семантическим поиском и AI-подсказками. Argilla используют в Red Cross и других организациях для задач классификации, RAG и тонкой настройки моделей.

🤖 GitHub

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 25 Jul 2025 18:56:07 +0300
Андрей Рыбинцев из Авито стал управляющим директором по ИИ

Также в компании будет сформирован новый кластер AI Experience. В этой роли вместе с командой из 900 специалистов он будет работать над развитием ассистентов на базе генеративных моделей, внедрение агентского ИИ и интеграцию ML в бизнес-процессы. Эти структурные изменения — сигнал, что компания настроена серьезно качнуть ИИ-направление.

За 10 лет в компании Рыбинцев курировал ключевые технологии: антифрод, автоматическую модерацию, IMV, A-Vibe, A-Vision. Сейчас фокус — системное масштабирование.
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 25 Jul 2025 15:45:13 +0300
🔮 SuperDuperDB — фреймворк для создания AI-приложений, напрямую интегрированных с базами данных. Позволяет развертывать модели машинного обучения и векторные поиски прямо в MongoDB, SQL, Snowflake или Redis, избегая сложных ETL-процессов.

Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.

🤖 GitHub

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Fri, 25 Jul 2025 13:21:20 +0300
Подробнее
25.69 k
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 24 Jul 2025 15:04:31 +0300
🤖 Сооснователь Anthropic Бен Манн:

🧠 «Вероятность того, что суперинтеллект появится в ближайшие годы — около 50%.
И это не просто спекуляция — за этим стоят данные, законы масштабирования и чёткие научные тренды».

Он подчёркивает: даже если технический прорыв случится быстро,
его влияние на общество может проявиться с задержкой — через годы.

📌 Вопрос уже не в том, "если", а "как скоро" — и что мы с этим сделаем.
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 24 Jul 2025 10:48:33 +0300
🎙 Lex Fridman выпустил новое интервью с Demis Hassabis — CEO Google DeepMind.

🔍 В подкасте — всё, что волнует мир ИИ:
— будущее AI & AGI
— моделирование биологии и физики
— видеоигры, программирование, генерация видео
— world models и Gemini 3
— scaling laws, вычисления, P vs NP
— сложность, энергия, солнце и термояд
и многое другое.

💡 Техническое, глубокое и очень увлекательное интервью. Настоящий разговор о том, куда идёт ИИ.

📺 Смотреть на youtube
📺 Смотреть в X

@data_analysis_ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Thu, 24 Jul 2025 09:10:49 +0300
✔️ OpenAI анонсировала дату проведения DevDay.

OpenAI объявила, что ее следующая конференция для разработчиков, DevDay, состоится 6 октября 2025 года в Сан-Франциско. На мероприятии выступят Сэм Альтман и Грэг Брокман. DevDay традиционно становится площадкой для главных анонсов OpenAI, и в этом году разработчикам обещают ранний доступ к информации о будущих продуктах и технологиях.

Конференция планирует собрать более 1500 разработчиков. Регистрация на очное участие открыта в формате подачи заявок до 30 июля, а приглашения будут разосланы в середине августа. Стоимость участия составит 650 долларов. Для тех, кто не сможет присутствовать лично, будет организована прямая трансляция основной части мероприятия, а записи остальных сессий опубликуют позже.
openai.com

✔️ Proton представила Lumo: защищенный чат-бот с фокусом на приватность.

Швейцарская компания Proton, известная своим одноименным почтовым сервисом, выпустила автономного ИИ-ассистента Lumo. Чат-бот позиционируется как безопасная альтернатива продуктам от крупных технологических корпораций.

Lumo умеет обобщать документы, писать код, составлять черновики писем и отвечать на веб-запросы. Сервис работает исключительно на открытых языковых моделях, размещенных в собственных дата-центрах Proton в Европе. Вся переписка защищена сквозным шифрованием с "нулевым доступом", что не позволяет самой компании или третьим лицам читать и хранить сообщения.

Попробовать Lumo можно без регистрации через веб-клиент или мобильные приложения, но с ограничениями. Платная подписка Lumo Plus за $12.99 в месяц снимает лимиты на общение и позволяет загружать файлы большего размера.
proton.me

✔️ Google DeepMind Aeneas: открытая ИИ-система для восстановления латинских надписей.

Google DeepMind выпустила Aeneas, опенсорсный инструмент на базе ИИ, предназначенный для помощи историкам в работе с фрагментарными древними надписями. Система анализирует неполные транскрипции и изображения, после чего определяет вероятное место и дату происхождения текста, предлагает варианты недостающих слов и находит аналоги в корпусе известных надписей.

Модель, обученная на 200 000 каталогизированных текстов, является развитием более ранней системы Ithaca для греческого языка. В исследовании, опубликованном в Nature, Aeneas улучшил генерацию научных гипотез в 90% случаев, а его оценки происхождения и датировки совпали с консенсусом ученых.

Aeneas доступна бесплатно для ученых, преподавателей и сотрудников музеев.
theguardian.com

✔️ AWS закрывает свою ИИ-лабораторию в Шанхае.

Amazon Web Services объявила о закрытии своей исследовательской ИИ-лаборатории в Шанхае. В компании это решение назвали трудным, оно завершает семилетнюю историю работы центра, который занимался передовыми разработками в области машинного обучения. По словам одного из научных сотрудников, подразделение расформировывают из-за "стратегических корректировок на фоне напряженности между США и Китаем".

Лаборатория, открытая в 2018 году, была весьма продуктивной: на ее счету более 100 научных публикаций и создание популярной open-source библиотеки Deep Graph Library. В лучшие времена в ней работало более 1000 человек.
ft.com

✔️ Компания Марка Цукерберга разработала нейромоторный браслет, работающий без персональной калибровки.

Устройство, разработанное в Reality Labs представляет собой браслет, который считывает электрическую активность мышц предплечья (sEMG), напрямую декодируя двигательные намерения пользователя.

Главное достижение - разработка универсальной модели, обученной на данных тысяч людей. В отличие от аналогов, требующих длительной настройки под каждого человека, эта система работает из коробки, без предварительной калибровки под новых пользователей.

В тестах интерфейс продемонстрировал распознавание рукописного ввода со скоростью почти 21 слово в минуту, точное определение дискретных жестов (щипки, свайпы) и плавное управление курсором. При этом короткая персональная донастройка на данных конкретного пользователя может повысить точность еще на 16%.
nature.com

@ai_machinelearning_big_data

#news #ai #ml
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 23 Jul 2025 15:46:20 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 23 Jul 2025 13:01:48 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Wed, 23 Jul 2025 11:36:58 +0300
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 22 Jul 2025 17:30:39 +0300
🔍T-one — открытая русскоязычная модель распознавания речи, выпущенная Т-Технологиями специально для звонков и телефонии

🧠 Главное:
— Обрабатывает речь кусками по 300 мс и запоминает контекст, подходит для реального времени

— Основа — Conformer и CTC-декодер, дополнительно подключается языковая модель (5-грамм, KenLM), чтобы повысить точность

— Задержка небольшая: около 1–1.2 секунды вместе с постобработкой

— Хорошо справляется с шумом, паузами и разговорной речью по телефону (8 кГц)

— Обучена на 80 тысячах часов аудио, в том числе 6 тысяч часов — это реальные телефонные звонки

— Используется в продуктах Т-Банка

— Дает заметно лучшее качество, если подключить языковую модель

https://habr.com/ru/companies/tbank/articles/929850/
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 22 Jul 2025 15:47:30 +0300
🧠 Нейроаналитик — AI-агент для анализа и визуализации данных от Yandex B2B Tech.

🔍 Что делает:
• Помогает искать инсайты в таблицах и графиках
• Строит и редактирует визуализации по запросу на естественном языке
• Ускоряет отчёты и проверку гипотез примерно на 30%
• Работает внутри BI-сервиса Yandex DataLens
• Доступен в облаке и on-premises
• Не требует знаний синтаксиса формул или кода

Построен на базе Yandex Cloud AI Studio, где также можно собирать своих ИИ-ассистентов. Первая версия фичи появится в сентябре этого года, а пока можно записаться в лист ожидания.

Реклама. ООО Яндекс.Облако. ИНН 7704458262
Подробнее
]]>
https://linkbaza.com/catalog/-1001684146975 Tue, 22 Jul 2025 12:56:08 +0300
🚨 BREAKING: Руководитель DeepMind резко раскритиковал заявление OpenAI о "золоте" на Международной математической олимпиаде (IMO)

IMO — это International Mathematical Olympiad (Международная математическая олимпиада).

📌 Это крупнейшее и престижнейшее соревнование по математике для школьников со всего мира. Впервые проведено в 1959 году, сегодня в нём участвуют более 100 стран.

>Прессслужба OpenAI сообщили, что их модель впервые в истории выиграла на IMO золото
> “У IMO есть внутренний протокол оценки, который никто извне не видит.
> Без него нельзя утверждать, что у вас 1 место.
> С потерей баллов на задаче P6 — это серебро, а не золото.”

📌 Что произошло:

— OpenAI не уведомлял IMO, но объявила о "первом месте" своей модели
— Объявление сделали до окончания церемонии IMO, нарушив просьбу не затмевать победу реальных студентов
— DeepMind, наоборот, работала с IMO официально и соблюдала все условия
— Научное сообщество обвиняет OpenAI в непрозрачности и неуважении к сообществу
— Пост был сделан без публикации всей методики и без согласования с организаторами

💬 Цитата из сообщества:
“OpenAI повела себя неуважительно и эгоистично. Нельзя сравнивать так модели и людей.”

🧠 Вопрос к читателю:
Где грань между научным прогрессом и этикой в публичных заявлениях ИИ-компаний?

@data_analysis_ml
Подробнее
]]>