Новый генератор изображений в ChatGPT: что умеет и как им пользоваться



Владельцы OpenAI добавили возможность редактировать загруженные фото и применять к ним различные стили. После очередного обновления нашумевшей модели ChatGPT социальные сети и интернет заполонили тысячи картинок на разную тему в стиле культовых франшиз и мультфильмов. Пользователи активно поддерживали новый тренд, публикуя переработанные фото – мемы, известные личности, семейные архивы и многое другое. К тренду присоединились даже представители правительства США.

Новые возможности

В конце марта инженеры OpenAI анонсировали новую версию генератора изображений для ChatGPT. Если ранее за работу с изображениями отвечала отдельная модель DALL-E, то после обновления функционал обеспечивается GPT-4o.

Известно, что нейросеть способна выделять отдельных персонажей и объекты на фото, чтобы применять отдельные стили. Модель хорошо справляется и с другими задачами – повышение детализации, добавление надписей, генерация графиков, создание чертежей и многое другое. Есть функция выделения главных мыслей из загруженного текста для вывода в формате зарисовки.

Как получить доступ

После официального анонса компания предоставила свободный доступ к новой версии всем желающим, однако их количество было настолько большим, что начали возникать проблемы с повышенной нагрузкой на инфраструктуру компании. Было принято решение ввести ряд ограничений – для пользователей без подписки доступно только три генерации в сутки.

Пользователи отмечают, что даже в рамках оформленной подписки могут наблюдаться задержки и появление незначительных артефактов. Представители компании подтвердили наличие проблем и даже обратились к сообществу с просьбой снизить количество генераций.

Для доступа к новому модулю достаточно авторизоваться на сайте ChatGPT и выбрать в параметрах модель GPT-4o. Генератор интегрирован и в популярный сервис Sora, для использования достаточно выбрать пункт Image при настройке нового запроса.

Стоит учитывать, что в силу последних событий платформа ChatGPT официально не работает на территории России, поэтому запуск возможен только после смены IP-адреса.

Как сгенерировать изображение

Данная функция доступна только в чате с GPT-4o. Общий алгоритм работы:

— перейти на сайт ChatGPT, в верхней части страницы будет меню выбора модели, необходимо выбрать режим GPT-4o.

— в поле ввода необходимо нажать на иконку с изображением трех точек, далее в меню выбрать пункт «Создать изображение»;

— в поле ввода водится необходимый промпт. В свободной форме кратко описываются основные требования к изображению. Указываются нужные объекты, стиль, фон и так далее.

— после получения готового изображения есть возможность перейти в режим редактирования путем нажатия на иконку с изображением карандаша.

В режиме редактирования можно выделять отдельную область, работать с отдельными объектами, менять фон и многое другое. После завершения работы сервис позволяет загрузить файл на устройство.

Стилизация изображений

Особенно пользователям приглянулся режим изменения стилей известных изображений из реального мира, на это указывает количество картинок на данную тему в различных социальных сетях. Оказалось, что фантазия у пользователей достаточно бурная – можно найти новые форматы известных мемов, известных личностей в неожиданной обстановке.

Для изменения стиля у картинки необходимо выполнить следующие шаги:

— повторно выбрать режим «Создать изображение»;

— нажать на иконку с изображением плюса и через окно проводника выбрать нужный файл на устройстве. Поддерживается загрузка нескольких файлов, что можно использовать для смешения стилей или переноса персонажей;

— в промпте подробно описать, что необходимо получить в результате.

Ограничения текущей версии

Разработчики пока устранили не все недостатки нового генератора изображений:

— часто встречаются серьезные ошибки. Например, на руке может оказаться шесть пальцев, неправильно подобрана перспектива или взаимное расположение предметов, неверно выбрана цветовая схема.

— нередко нейросеть просто отказывается генерировать изображение, ссылаясь на авторские права. Обычно это касается известных франшиз, но происходит это без явной системы. К примеру, сервис может сгенерировать два изображения в стиле известной студии, а при попытке получить третье отобразится уведомление о нарушении авторских прав.

— серверы компании пока не справляются с нагрузкой. Периодически принудительно добавляются перерывы для разгрузки системы.



Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: