Google випустила Gemini 3.1 Pro – AI-модель, яка вдвічі перевершує попередню версію у тестах на логічне мислення. Оновлення побудоване на тій самій базі, що й режим Deep Think – спеціалізований інструмент для наукових та інженерних задач. Gemini 3.1 Pro уже доступна для розробників і користувачів у тестовому режимі – повний реліз Google обіцяє найближчим часом.
Що нового в Gemini 3.1 Pro
Між Gemini 3 Pro та оновленням пройшло лише три місяці, доволі швидкий цикл для Google. Головне покращення перейшло з Deep Think, який компанія створювала разом із науковцями. Він заточений під задачі без єдиного правильного рішення – коли вхідні дані неповні або суперечливі. Раніше для цього потрібно було вмикати окремий режим, тепер модель думає на такому рівні за замовчуванням. І результати тестів це підтверджують.
Gemini 3.1 Pro у цифрах
На тесті ARC-AGI-2, який оцінює здатність розв’язувати абсолютно нові логічні задачі, Gemini 3.1 Pro набрала 77,1% проти 31,1% у попередньої версії.
Інші результати:
- Humanity’s Last Exam (експертні питання з різних наук) – 44,4% (Gemini 3 Pro – 37,5%, GPT-5.2 – 34,5%).
- GPQA Diamond (питання рівня PhD з фізики, біології та хімії) – 94,3%.
- SWE-Bench Verified (виправлення реальних багів у коді) – 80,6%.
- LiveCodeBench Pro (складні алгоритмічні завдання) – рейтинг Elo 2887.
Для порівняння: режим Deep Think раніше набрав 84,6% на ARC-AGI-2 (підтверджено ARC Prize Foundation) та показав рівень золотих медалей на Міжнародній математичній олімпіаді 2025 року. Базова модель майже наздогнала його.
Але Gemini 3.1 Pro виграє не скрізь. У рейтингу Arena (раніше LM Arena), де якість відповідей оцінюють самі користувачі, у текстових задачах краще показує себе Claude Opus 4.6. У програмуванні теж попереду конкуренти – Opus 4.6, Opus 4.5 та GPT-5.2 High.
Практичне застосування
Google виділяє кілька сценаріїв, де модель має бути найкориснішою. Gemini 3.1 Pro збирає дані з різних джерел і зводить їх у єдину картину – наприклад, у графік або структуровану вибірку. Ще один напрям – наочне пояснення складних тем: від наукових концепцій до технічної документації. Також 3.1 Pro генерує анімовані SVG-зображення з текстових запитів. На відміну від растрової графіки чи відео, такі файли не втрачають якість при збільшенні і займають мінімум місця.
Для розробників агентних систем теж є прогрес – у тесті APEX-Agents оцінка 3.1 Pro зросла до 33,5% порівняно з 18,4% у попередньої версії.
Де доступна модель
З 19 лютого Gemini 3.1 Pro доступна у тестовому режимі:
- Для розробників – через Gemini API у Google AI Studio, Gemini CLI, платформу Google Antigravity та Android Studio.
- Для бізнесу – у Vertex AI та Gemini Enterprise.
- Для користувачів – у застосунку Gemini (з вищими лімітами для підписників Google AI Pro та Ultra) і в NotebookLM (ексклюзивно для підписників Pro та Ultra).
Вартість API для програмістів не змінилася – $2 за мільйон вхідних токенів і $12 за мільйон вихідних. Контекстне вікно залишилося на рівні 1 мільйон токенів на вхід і 64 000 на відповідь.
Google поки що збирає фідбек перед повноцінним запуском. Наступний фокус – агентні сценарії, де AI самостійно виконує багатокрокові завдання.
Складно визначитися?
За 5 хв пройди тест із підбору професії
Він підкаже, який напрямок найбільше відповідає твоїм здібностям та попередньому досвіду
Пройти тест