Решил погонять картинки, а именно сравнить новый Qwen Image с другими моделями
Будет 5 промптов, каждый проверяет отдельную возможность модели. Результаты загружал на imgur надеюсь вам будет не лень зайти посмотреть) по другому не получилось бы нормально сгруппировать нужные изображения, собственно сразу к делу
Промпт 1 (простой брендинг): "Фотография современной кофейни в минималистичном стиле. На белой стене висит элегантная деревянная вывеска с четкой надписью 'The Daily Grind'. Утренний свет падает через большие окна, фотореализм."
Что проверяем: Точность написания, стиль шрифта, органичность вписывания текста в окружение.
Результаты
Промпт 2 (Сложный постер): "Постер к научно-фантастическому фильму в стиле ретро 80-х. На переднем плане — винтажный космический корабль. Вверху крупными неоновыми буквами написано название: 'CHRONO ECHOES'. Ниже, более мелким шрифтом, слоган: 'The Future is in the Past'. Звездное небо на фоне. Кинематографично."
Что проверяем: Способность работать с несколькими текстовыми блоками разного размера и стиля, общую композицию.
Результаты
Промпт 3 (Точное расположение объектов): "Вид сверху на деревянный рабочий стол. В левом верхнем углу лежит открытый ноутбук. В центре стола стоит белая керамическая чашка с кофе. Справа от чашки лежит синяя ручка, указывающая на блокнот. Фотореалистичный стиль."
Что проверяем: Понимание относительных положений ("слева", "справа от", "в центре")
Результаты
Промпт 4 (Взаимодействие персонажей):"Два астронавта в скафандрах стоят на поверхности Марса. Один астронавт протягивает другому красный геологический молоток. На заднем плане виден марсоход и далекие горы под оранжевым небом."
Что проверяем: Способность правильно изобразить сложное взаимодействие между персонажами и объектами.
Результаты
Последняя задача на изменение объекта
Начальное изображение: Сгенерируй "человек сидит на диване в гостиной и держит в руках обычную книгу".
Инструкция для редактирования: "Выдели книгу и замени ее на светящийся планшет."
Что проверяем: Насколько органично и реалистично модель заменит один объект на другой, сохранив при этом позу рук и освещение.
Результаты
Не могу сказать что Qwen Image чем то выделяется или имеет значительное преимущество, но тем не менее он очень хорошо следует промпту (не считая взаимодействия персонажей, ну и расположение объектов мне не очень понравилось, но в нем все не дотянули) и справляется со своей задачей, тем более он бесплатный и в qwen чате хоть облепись этими изображениями, лимит большой