OpenAI повідомила, що протягом наступного місяця запустить батьківський контроль у ChatGPT і почне автоматично спрямовувати «чутливі» розмови до reasoning-моделей на кшталт GPT-5-thinking. Компанія пояснює, що такі моделі довше «міркують» над контекстом і краще протистоять провокаційним запитам.
Це частина реакції компанії на нещодавні інциденти, пов’язані з безпекою, коли ChatGPT не розпізнав психічний дистрес користувачів. Після смерті підлітка Адама Рейна, який обговорював із ChatGPT самопошкодження та плани самогубства, а також отримав інформацію про конкретні методи, батьки подали проти OpenAI позов про неправомірну смерть. Минулого тижня у блозі OpenAI визнала недоліки своїх систем безпеки, зокрема збої у підтриманні запобіжників під час тривалих розмов.
Експерти пов’язують ці проблеми з базовими властивостями моделей штучного інтелекту: схильністю підтверджувати фразу користувача та алгоритмами передбачення наступного слова, через що чатботи йдуть за ниткою діалогу, а не перенаправляють потенційно небезпечні обговорення, пише TechCrunch
«Нещодавно ми запровадили роутер у реальному часі, який може обирати між ефективними чат-моделями та моделями міркування залежно від контексту розмови. Невдовзі ми почнемо спрямовувати деякі чутливі розмови — наприклад, коли система виявляє ознаки гострого дистресу — до моделі міркування, як-от GPT-5-thinking, щоб вона могла надавати корисніші й безпечніші відповіді, незалежно від того, яку модель користувач спочатку обрав», — йдеться у новому дописі компанії.
За словами представників OpenAI, GPT-5-thinking та моделі лінійки o3 побудовані так, щоб витрачати більше часу на осмислення контексту перед відповіддю, тож вони «стійкіші до провокаційних промптів».
Крім того, OpenAI оголосила про створення батьківського контролю протягом наступного місяця. Батьки зможуть пов’язати свій акаунт із підлітковим через email-запрошення та керувати тим, як ChatGPT відповідає їхній дитині, — за допомогою «вікових правил поведінки моделі», які будуть увімкнені за замовчуванням. Також батьки отримуватимуть сповіщення, коли система виявлятиме, що їхній підліток перебуває в стані гострого стресу.
Раніше ми писали, що OpenAI представила нову функцію ChatGPT — режим навчання