17 липня 2025 року компанія OpenAI оголосила про запуск нового інструменту — ChatGPT agent, що здатен автоматизувати широкий спектр комп’ютерних завдань. Це — найамбітніша спроба компанії перетворити ChatGPT з інформаційного помічника на повноцінного агентного виконавця, який може діяти від імені користувача.
Новий агент поєднує можливості кількох попередніх експериментів OpenAI. Наприклад, він уміє:
- працювати з календарем користувача;
- створювати редаговані презентації;
- запускати код;
- виконувати дії у вебінтерфейсах (на зразок інструменту Operator);
- збирати і синтезувати інформацію з десятків сайтів у стислий звіт (як Deep Research).
Усе це можна активувати простими запитами в природній мові — достатньо написати в інтерфейсі ChatGPT, що потрібно зробити. Доступ до агента отримають користувачі тарифних планів Pro, Plus і Team після активації “agent mode” у випадаючому меню інструментів (наразі опція поступово зʼявляється у користувачів).
ChatGPT can now do work for you using its own computer.
— OpenAI (@OpenAI) July 17, 2025
Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ
OpenAI наводить приклади завдань, які під силу новому агенту:
- спланувати та купити інгредієнти для японського сніданку на чотирьох;
- проаналізувати трьох конкурентів і створити слайд-презентацію.
Ці запити вимагають від агента не лише розуміння тексту, а й дій: відвідин сайтів, прийняття рішень, запуску інструментів. Це суттєвий крок уперед у порівнянні з попередніми системами.
ChatGPT agent має доступ до:
- ChatGPT Connectors — для взаємодії з Gmail, GitHub та іншими додатками;
- терміналу — для виконання команд і запуску коду;
- API — для зв’язку з іншими сервісами.
Це дає змогу агенту працювати у складних робочих середовищах, автоматизуючи не лише інформаційні, а й практичні завдання.
Потужність моделі та бенчмарки
За словами OpenAI, модель, що лежить в основі ChatGPT agent, демонструє:
- 41,6% на “Humanity’s Last Exam” (pass@1) — удвічі більше, ніж моделі o3 та o4-mini;
- 27,4% на FrontierMath із доступом до інструментів, проти 6,3% у o4-mini.
З огляду на нові можливості, OpenAI вжила низку заходів безпеки:
- класифікатор запитів у реальному часі перевіряє кожен запит на біологічну тематику;
- у випадку виявлення теми — друга перевірка оцінює ризики, пов’язані з біозагрозами;
- відключено функцію пам’яті в агенті — щоб унеможливити викрадення чутливої інформації через prompt injection.
Хоча OpenAI стверджує, що ChatGPT agent значно перевершує попередні версії, у реальному світі агентні системи часто стикаються з непередбачуваними проблемами. Утім, якщо обіцянки справдяться, новий агент стане кроком до повноцінного цифрового асистента — не лише для розмов, а й для дій.
Запуск ChatGPT agent — це те, чого чекали всі: створення ШІ-агентів, здатних брати на себе повноцінні робочі завдання. Поки ці системи ще далекі від досконалості, але потенціал їх застосування — надзвичайно широкий.
Щопʼятниці отримуйте найцікавіші статті за тиждень на ваш імейл.