У ChatGPT-4o додали безплатний генератор зображень

Компанія OpenAI представила нову функцію генерації зображень, інтегровану в модель GPT‑4o. Вона дає змогу створювати не лише естетично привабливі, а й практичні зображення, такі як діаграми, логотипи та інфографіки.

GPT‑4o здатна точно слідувати складним текстовим описам, обробляючи до 10-20 об’єктів в одному зображенні. Це забезпечує більш точне відображення деталей та взаємозв’язків між об’єктами, йдеться в офіційному блозі OpenAI. Модель може аналізувати завантажені користувачем зображення та використовувати їх як контекст для генерації нових, що дає змогу створювати зображення на основі наданих візуальних даних.

GPT‑4o демонструє поліпшену здатність створювати фотореалістичні зображення та адаптуватися до різних художніх стилів, що розширює можливості для творчості та професійного використання. У своєму блозі OpenAI продемонстрували кілька прикладів роботи GPT-4o. Він створював комікси, покроково перетворював фото кота на ігрового персонажа, генерував структуровані таблиці, графіки та формули. Також серед помітних удосконалень — читабельний текст, його зручне розміщення та високий рівень фотореалістичності.

Серед прикладів генерації зображень новою моделлю, які OpenAI показала у своєму блозі, було таке завдання для ШІ:

Створити фотореалістичне зображення двох молодих відьом у міському середовищі.

Опис сцени:

На випадковій вулиці Нью-Йорка стоїть дорожній стовп, повністю вкритий вуличними знаками. Серед них є реалістичні, офіційного вигляду знаки із жартівливими повідомленнями, наприклад:

«Парковка для відьом на мітлах заборонена в зоні C»;
«Завантаження та розвантаження чарівного килима – 15-хвилинний ліміт»;
«Паркування оленів лише за дозволом (24-25 грудня)».

Персонажі:

Одна відьма має попелястий балаяж і тримає мітлу.
Друга — з довгим хвилястим каштановим волоссям, несе згорнутий чарівний килим.
Обидві стоять на передньому плані, трохи повернуті спиною до камери, уважно вчитуються в знаки.

Композиція:
Віддалене тло з припаркованими машинами, будівлі, дорожній знак та відьми.

OpenAI визнає, що модель може мати обмеження, такі як складнощі з відображенням великої кількості об’єктів або тексту на зображеннях. Для запобігання зловживанням впроваджено заходи безпеки, зокрема блокування шкідливого контенту та додавання метаданих C2PA для позначення згенерованих ШІ-зображень.

Функція генерації зображень GPT‑4o доступна користувачам ChatGPT на різних рівнях передплати. З певними обмеженнями вона доступна й у безплатній версії.

Раніше ми писали, що ChatGPT тепер має функцію пошуку в інтернеті