...
Обрати професію На платформу

Пройди тест:
Хто я в IT?

Для тих, хто не визначився з професією, але хоче змінити роботу

Хочу зрозуміти, хто я в IT
Пройти тест

Google випустила Gemini 3.1 Pro: модель розв’язує складні задачі вдвічі краще

  • ~ 3 хв

Google випустила Gemini 3.1 Pro – AI-модель, яка вдвічі перевершує попередню версію у тестах на логічне мислення. Оновлення побудоване на тій самій базі, що й режим Deep Think – спеціалізований інструмент для наукових та інженерних задач. Gemini 3.1 Pro уже доступна для розробників і користувачів у тестовому режимі – повний реліз Google обіцяє найближчим часом.

Що нового в Gemini 3.1 Pro

Між Gemini 3 Pro та оновленням пройшло лише три місяці, доволі швидкий цикл для Google. Головне покращення перейшло з Deep Think, який компанія створювала разом із науковцями. Він заточений під задачі без єдиного правильного рішення – коли вхідні дані неповні або суперечливі. Раніше для цього потрібно було вмикати окремий режим, тепер модель думає на такому рівні за замовчуванням. І результати тестів це підтверджують.

Gemini 3.1 Pro у цифрах

На тесті ARC-AGI-2, який оцінює здатність розв’язувати абсолютно нові логічні задачі, Gemini 3.1 Pro набрала 77,1% проти 31,1% у попередньої версії.

Інші результати:

  • Humanity’s Last Exam (експертні питання з різних наук) – 44,4% (Gemini 3 Pro – 37,5%, GPT-5.2 – 34,5%).
  • GPQA Diamond (питання рівня PhD з фізики, біології та хімії) – 94,3%.
  • SWE-Bench Verified (виправлення реальних багів у коді) – 80,6%.
  • LiveCodeBench Pro (складні алгоритмічні завдання) – рейтинг Elo 2887.

Для порівняння: режим Deep Think раніше набрав 84,6% на ARC-AGI-2 (підтверджено ARC Prize Foundation) та показав рівень золотих медалей на Міжнародній математичній олімпіаді 2025 року. Базова модель майже наздогнала його.

Але Gemini 3.1 Pro виграє не скрізь. У рейтингу Arena (раніше LM Arena), де якість відповідей оцінюють самі користувачі, у текстових задачах краще показує себе Claude Opus 4.6. У програмуванні теж попереду конкуренти – Opus 4.6, Opus 4.5 та GPT-5.2 High.

Практичне застосування

Google виділяє кілька сценаріїв, де модель має бути найкориснішою. Gemini 3.1 Pro збирає дані з різних джерел і зводить їх у єдину картину – наприклад, у графік або структуровану вибірку. Ще один напрям – наочне пояснення складних тем: від наукових концепцій до технічної документації. Також 3.1 Pro генерує анімовані SVG-зображення з текстових запитів. На відміну від растрової графіки чи відео, такі файли не втрачають якість при збільшенні і займають мінімум місця.

Для розробників агентних систем теж є прогрес – у тесті APEX-Agents оцінка 3.1 Pro зросла до 33,5% порівняно з 18,4% у попередньої версії.

Де доступна модель

З 19 лютого Gemini 3.1 Pro доступна у тестовому режимі:

  • Для розробників – через Gemini API у Google AI Studio, Gemini CLI, платформу Google Antigravity та Android Studio.
  • Для бізнесу – у Vertex AI та Gemini Enterprise.
  • Для користувачів – у застосунку Gemini (з вищими лімітами для підписників Google AI Pro та Ultra) і в NotebookLM (ексклюзивно для підписників Pro та Ultra).

Вартість API для програмістів не змінилася – $2 за мільйон вхідних токенів і $12 за мільйон вихідних. Контекстне вікно залишилося на рівні 1 мільйон токенів на вхід і 64 000 на відповідь.

Google поки що збирає фідбек перед повноцінним запуском. Наступний фокус – агентні сценарії, де AI самостійно виконує багатокрокові завдання.

Складно визначитися?

За 5 хв пройди тест із підбору професії

Він підкаже, який напрямок найбільше відповідає твоїм здібностям та попередньому досвіду

Пройти тест
Пройти тест

Складно визначитися?

За 3 хв пройди тест із підбору професії

Він підкаже, який напрямок найбільше відповідає твоїм здібностям та попередньому досвіду

Пройти тест

Ще почитати

Про навички, професії та роботу в IT