Небольшой полу-оффтоп
Понадобилось мне устроить банкет, решил обратиться за помощью к нейронкам. План был такой:
1. Считать с изображений блюда, вес и цену
2. Составить меню на n кол-во гостей
3. Посчитать стоимость
Юзал GPT-5 (Thinking), Gemini 2.5 Pro, Grok 4, Claude 4.5 Sonnet (Thinking). Пробовал как в Ламе, так и на оф.сайте. И, к моему удивлению, полностью с заданием не справилась ни одна.
Самая частая проблема — выдумывание граммовки и цен. Пробовал просто просить переписать текст с картинок — никаких проблем, но как только доходило до основного задания, опять начинались галлюцинации. Пробовал разбивать задачи на несколько этапов, переформулировать промпты — безрезультатно.
Из менее критичного и забавного: Грок составил меню, которым можно было бы кормить 100 человек целую неделю 🤭. А Клауд, наоборот, зажал по полной.
Интересно, это я делал что-то не так или задача подсильна только GPT-6 😏?
Угадаете, кстати, какая нейронка картинку сгенерировала?