5 березня OpenAI випустила GPT-5.4. Модель керує комп’ютером, пише та виправляє код, працює з таблицями та презентаціями. Також вийшла GPT-5.4 Pro з більшим обчислювальним ресурсом для найскладніших запитів.

Як GPT-5.4 справляється з роботою фахівців

Бенчмарк GDPval ставить AI на місце спеціалістів у 44 професіях і визначає, хто впорається краще. За результатами тесту GPT-5.4 зрівнялася з людьми або перевершила їх у 83% випадків. У GPT-5.2 цей показник становив 70,9%.

OpenAI окремо відзначає покращення в офісних задачах. На внутрішніх випробуваннях GPT-5.4 працювала з таблицями на рівні молодшого аналітика інвестбанку. Результат – 87,5% проти 68,4% у попередньої версії. В оцінці презентацій експерти у 68% випадків віддали перевагу GPT-5.4 – завдяки кращій естетиці та різноманітності візуалів.

Перша універсальна модель OpenAI, що керує комп’ютером

Вона пише код через бібліотеки на кшталт Playwright і надсилає команди миші й клавіатурі на основі скриншотів. Контекстне вікно – до 1 мільйона токенів, що дає змогу виконувати довгі багатокрокові сценарії.

У бенчмарку OSWorld-Verified, який перевіряє здатність AI орієнтуватися на робочому столі, GPT-5.4 досягла 75% точності. Людський рівень на цьому ж тесті – 72,4%, а GPT-5.2 показала лише 47,3%.

Що змінилося для розробників

GPT-5.4 взяла найкраще з GPT-5.3-Codex і додала нові можливості для AI-агентів. У бенчмарку SWE-Bench Pro, де AI виправляє баги в реальних репозиторіях, результат – 57,7% проти 56,8% у GPT-5.3-Codex.

За даними OpenAI, GPT-5.4 значно краще справляється зі складними завданнями у фронтенді. В Codex – AI-середовищі для розробників – додали режим /fast, який генерує код у 1,8 раза швидше.

Менше помилок і режим Thinking

OpenAI називає GPT-5.4 своєю найточнішою моделлю. За даними компанії, хибних тверджень стало на 33% менше, а повних відповідей з помилками – на 18% менше порівняно з GPT-5.2.

У ChatGPT модель працює в режимі Thinking: перед складними запитами описує план дій. Відповідь можна скоригувати ще до завершення генерації. Також покращено глибокий вебпошук – особливо для вузьких тем із багатьма джерелами.

Доступ, ціни та безпека

GPT-5.4 Thinking вже працює для користувачів ChatGPT Plus, Team і Pro. Власники планів Enterprise та Edu можуть увімкнути її в налаштуваннях адміністратора. GPT-5.4 Pro відкрита на тарифах Pro та Enterprise.

В API ціна – $2,50 за мільйон вхідних токенів і $15 за мільйон вихідних. GPT-5.2 коштувала $1,75 і $14 відповідно. Утім, в OpenAI зазначають, що GPT-5.4 ефективніша і потребує менше токенів на ті самі задачі.З огляду на потужність, OpenAI розгортає GPT-5.4 із посиленими заходами безпеки. Серед них – моніторинг, контроль доступу та блокування запитів із підвищеним ризиком.