fbpx
Slow news

У ChatGPT-4o додали безплатний генератор зображень

Модель може створювати точні й фотореалістичні зображення
Кірста Олена, 26.03.2025

Компанія OpenAI представила нову функцію генерації зображень, інтегровану в модель GPT‑4o. Вона дає змогу створювати не лише естетично привабливі, а й практичні зображення, такі як діаграми, логотипи та інфографіки.

GPT‑4o здатна точно слідувати складним текстовим описам, обробляючи до 10-20 об’єктів в одному зображенні. Це забезпечує більш точне відображення деталей та взаємозв’язків між об’єктами, йдеться в офіційному блозі OpenAI. Модель може аналізувати завантажені користувачем зображення та використовувати їх як контекст для генерації нових, що дає змогу створювати зображення на основі наданих візуальних даних.

GPT‑4o демонструє поліпшену здатність створювати фотореалістичні зображення та адаптуватися до різних художніх стилів, що розширює можливості для творчості та професійного використання. У своєму блозі OpenAI продемонстрували кілька прикладів роботи GPT-4o. Він створював комікси, покроково перетворював фото кота на ігрового персонажа, генерував структуровані таблиці, графіки та формули. Також серед помітних удосконалень — читабельний текст, його зручне розміщення та високий рівень фотореалістичності.

Серед прикладів генерації зображень новою моделлю, які OpenAI показала у своєму блозі, було таке завдання для ШІ:

Створити фотореалістичне зображення двох молодих відьом у міському середовищі.

Опис сцени:

На випадковій вулиці Нью-Йорка стоїть дорожній стовп, повністю вкритий вуличними знаками. Серед них є реалістичні, офіційного вигляду знаки із жартівливими повідомленнями, наприклад:

  • «Парковка для відьом на мітлах заборонена в зоні C»;
  • «Завантаження та розвантаження чарівного килима – 15-хвилинний ліміт»;
  • «Паркування оленів лише за дозволом (24-25 грудня)».

Персонажі:

  1. Одна відьма має попелястий балаяж і тримає мітлу.
  2. Друга — з довгим хвилястим каштановим волоссям, несе згорнутий чарівний килим.
  3. Обидві стоять на передньому плані, трохи повернуті спиною до камери, уважно вчитуються в знаки.

Композиція:
Віддалене тло з припаркованими машинами, будівлі, дорожній знак та відьми.

OpenAI визнає, що модель може мати обмеження, такі як складнощі з відображенням великої кількості об’єктів або тексту на зображеннях. Для запобігання зловживанням впроваджено заходи безпеки, зокрема блокування шкідливого контенту та додавання метаданих C2PA для позначення згенерованих ШІ-зображень.

Функція генерації зображень GPT‑4o доступна користувачам ChatGPT на різних рівнях передплати. З певними обмеженнями вона доступна й у безплатній версії. 

Читайте також у рубриці Slow news
Кондитерська «Номер Дому» створила набір шоколадок із зашифрованими творами української літератури
Дизайн, смак та літературний код: що особливого в «Книзі Сенсів»?
Інстаграм запускає програму співпраці зі школами 
Функція вже доступна й допоможе в боротьбі з кібербулінгом
Дім Рональда МакДональда в Португалії створив лампи, що світяться лише разом
У такий спосіб прагнуть підтримати родини в процесі одужання дітей
Антоніо Лукіч зняв короткометражку про поїздку пера з його фільму в таксі
Стрічка «Найлегший пасажир в історії» з’явилась до 15-річчя Uklon
SEO-тренди 2025: які зміни диктують штучний інтелект і Google
2POINT Digital Agency назвала ключові чинники успішної пошукової оптимізації
Інші статті за темами
Підписатися
Підпишись на нашу розсилку і будь в курсі всіх оновлень
Підпишись на нашу розсилку і будь в курсі всіх оновлень