fbpx
Slow news

У ChatGPT-4o додали безплатний генератор зображень

Модель може створювати точні й фотореалістичні зображення
Кірста Олена, 26.03.2025

Компанія OpenAI представила нову функцію генерації зображень, інтегровану в модель GPT‑4o. Вона дає змогу створювати не лише естетично привабливі, а й практичні зображення, такі як діаграми, логотипи та інфографіки.

GPT‑4o здатна точно слідувати складним текстовим описам, обробляючи до 10-20 об’єктів в одному зображенні. Це забезпечує більш точне відображення деталей та взаємозв’язків між об’єктами, йдеться в офіційному блозі OpenAI. Модель може аналізувати завантажені користувачем зображення та використовувати їх як контекст для генерації нових, що дає змогу створювати зображення на основі наданих візуальних даних.

GPT‑4o демонструє поліпшену здатність створювати фотореалістичні зображення та адаптуватися до різних художніх стилів, що розширює можливості для творчості та професійного використання. У своєму блозі OpenAI продемонстрували кілька прикладів роботи GPT-4o. Він створював комікси, покроково перетворював фото кота на ігрового персонажа, генерував структуровані таблиці, графіки та формули. Також серед помітних удосконалень — читабельний текст, його зручне розміщення та високий рівень фотореалістичності.

Серед прикладів генерації зображень новою моделлю, які OpenAI показала у своєму блозі, було таке завдання для ШІ:

Створити фотореалістичне зображення двох молодих відьом у міському середовищі.

Опис сцени:

На випадковій вулиці Нью-Йорка стоїть дорожній стовп, повністю вкритий вуличними знаками. Серед них є реалістичні, офіційного вигляду знаки із жартівливими повідомленнями, наприклад:

  • «Парковка для відьом на мітлах заборонена в зоні C»;
  • «Завантаження та розвантаження чарівного килима – 15-хвилинний ліміт»;
  • «Паркування оленів лише за дозволом (24-25 грудня)».

Персонажі:

  1. Одна відьма має попелястий балаяж і тримає мітлу.
  2. Друга — з довгим хвилястим каштановим волоссям, несе згорнутий чарівний килим.
  3. Обидві стоять на передньому плані, трохи повернуті спиною до камери, уважно вчитуються в знаки.

Композиція:
Віддалене тло з припаркованими машинами, будівлі, дорожній знак та відьми.

OpenAI визнає, що модель може мати обмеження, такі як складнощі з відображенням великої кількості об’єктів або тексту на зображеннях. Для запобігання зловживанням впроваджено заходи безпеки, зокрема блокування шкідливого контенту та додавання метаданих C2PA для позначення згенерованих ШІ-зображень.

Функція генерації зображень GPT‑4o доступна користувачам ChatGPT на різних рівнях передплати. З певними обмеженнями вона доступна й у безплатній версії. 

Читайте також у рубриці Slow news
Burger King створив ШІ-асистента для аналізу ввічливості персоналу в США
Чатбот, який фіксує слова «будь ласка» й «дякую», під’єднують до гарнітур працівників ресторанів
Stanley представив першу колекцію мисок для тварин у стилі своїх фірмових пляшок
Бренд розширює асортимент і виходить на ринок товарів для домашніх улюбленців
До Всесвітнього дня слуху стартувала благодійна кампанія «Чуєш? Вона грає в тебе в голові»
Мета — зібрати кошти на підтримку військових із травмами слуху та привернути увагу до цієї проблеми
MacPaw Foundation проведе в Києві виставку Олени Грішиної «Квіти пам’яті» з благодійним аукціоном
За зібрані кошти придбають комплекс для евакуації поранених без залучення екіпажу
Укргідрометцентр тестує мобільний застосунок «цеПогода»
Користувачам доступні інтерактивні карти та попередження про небезпечні явища
Інші статті за темами
Підписатися
Підпишись на нашу розсилку і будь в курсі всіх оновлень
Підпишись на нашу розсилку і будь в курсі всіх оновлень