🤖 Что такое object-centric в машинном обучении
В машинном обучении есть подход, который заставляет модель смотреть на данные «по-человечески» — object-centric.
Это когда модель не видит картинку как груду пикселей.
Она видит отдельные объекты — стол, кружку, кота — и работает именно с ними.
Зачем это нужно?
➡️ Лучшее обобщение.
Если модель понимает, что такое «объект», она легче переносит знания на новые сцены.
➡️ Объяснимость.
Модель фактически говорит: «объект №1 — куб», «объект №2 — шар».
➡️ Манипуляции объектами.
Важно в робототехнике, моделях мира, генерации сцен: можно двигать объекты, комбинировать их, прогнозировать взаимодействия.
Где используется:
• безучительское обучение (Slot Attention, MONet)
• модели мира (Dreamer, Genesis)
• генерация изображений
• робототехника и video understanding
Проще всего:
• обычная нейросеть → «вижу пиксели»
• object-centric сеть → «вижу вещи»
🐸 Библиотека дата-сайентиста
#буст