Компанія OpenAI оголосила про запуск багатофункціонального ШІ-агента Operator, що здатен автономно виконувати завдання через веббраузер.
Operator — це інноваційний ШІ-агент, який об’єднує здатності моделі GPT-4o від OpenAI з новими алгоритмами для роботи з вебінтерфейсами. Він може імітувати людську взаємодію з вебсайтами. Наприклад, натискати кнопки, заповнювати форми та переміщатися в меню. Новий інструмент дає змогу автоматизувати низку завдань, як-от бронювання подорожей, замовлення їжі або купівля товарів онлайн, пише TechCrunch.

Основні функції та можливості:
Автоматизація завдань. Operator пропонує швидке виконання завдань у таких категоріях, як доставка, подорожі, заклади харчування, покупки.
Інтерактивний інтерфейс. Користувачі можуть спостерігати за діями ШІ через спеціальний браузер у вікні, де відтворюються всі кроки, що виконує агент.
Параметри безпеки. Operator запитує підтвердження від користувача перед завершенням дій на кшталт надсилання електронних листів або оформлення замовлень.
Як це працює?
ШІ-агент використовує модель Computer-Using Agent (CUA), без використання API. Це означає, що Operator може взаємодіяти безпосередньо з інтерфейсом вебсайтів і виконувати завдання так, як це робить людина. У OpenAI розповіли, що вже співпрацюють з такими платформами, як DoorDash, eBay, Instacart, Uber та іншими.

На цьому етапі Operator має низку обмежень. Агент поки не може працювати з нестандартними інтерфейсами, створювати детальні презентації або виконувати завдання, що потребують високої спеціалізації. Також для роботи з конфіденційними даними, наприклад, під час банківських операцій, потрібен безпосередній контроль користувача. А в разі потреби перевірки з CAPTCHA або складними формами ШІ-агент потребує втручання користувача. На поточному етапі запуску Operator також не виконуватиме деякі завдання з міркувань безпеки: не надсилатиме електронні листи та не видалятиме події в календарі, хоча технологія CUA дає змогу це зробити.
