9 марта Anthropic представила Code Review – новый инструмент в Claude Code, который автоматически проверяет pull request (PR) – запросы на добавление изменений в проект. Несколько AI-агентов параллельно анализируют PR и выявляют баги еще до того, как код попадет в продакшн.
Какую проблему решает Code Review
Code review – это стандартный этап разработки, когда коллеги проверяют чужой код перед тем, как он станет частью проекта. Обычно это делает человек, но когда изменений становится больше – ревью не успевает за разработкой.
По данным Anthropic, каждый инженер компании стал писать на 200% больше кода, чем год назад – в основном благодаря AI-генерации. Количество PR выросло, а качество их проверки упало. До запуска Code Review внутри компании только 16% PR получали содержательные замечания, а после этого показатель вырос до 54%.
Как команда AI-агентов проверяет pull request
Code Review интегрируется с GitHub и после активации запускается автоматически при каждом PR. Система построена на мультиагентной архитектуре: несколько агентов одновременно ищут баги, верифицируют находки и ранжируют их по серьезности. Отдельный агент собирает все воедино и убирает дубликаты.
Масштаб работы зависит от объема изменений: для сложных PR привлекается больше агентов, для мелких – хватает быстрого обзора. Среднее время на один PR – около 20 минут. Фокус – именно на ошибках в логике, а не на стиле кода. Серьезность обозначается цветами: красный – критические ошибки, желтый – потенциальные проблемы, фиолетовый – баги, которые уже были в коде до этого PR. Для более глубокого аудита безопасности существует отдельный продукт – Claude Code Security.
Что показали месяцы тестирования внутри Anthropic
Компания тестировала Code Review на собственных репозиториях в течение нескольких месяцев. В крупных PR (более 1000 измененных строк) инструмент фиксировал баги в 84% случаев – в среднем 7,5 на один PR. Даже в мелких PR (до 50 строк) – в каждом третьем. При этом менее 1% замечаний инженеры признали ложными – то есть система почти не ошибается.
В одном из кейсов маленькая правка в продакшн-сервисе выглядела рутинной и обычно получила бы быстрое одобрение. Но Code Review классифицировал ее как критическую – изменение сломало бы аутентификацию. Разработчик потом признался, что сам бы этого не заметил.
Схожую эффективность подтвердила команда TrueNAS: во время рефакторинга модуля шифрования Code Review нашел старый баг в коде, который PR напрямую не затрагивал. Дефект тихо очищал кеш криптографических ключей при каждой синхронизации – обнаружить такое вручную при ревью почти невозможно.
Сколько стоит и кто уже может попробовать Code Review
Code Review – платный инструмент, цена которого не входит в подписку. Средняя стоимость анализа одного PR – $15–25 в зависимости от размера и сложности. Сейчас он доступен в режиме research preview для подписчиков Team и Enterprise. Администраторы могут установить месячный лимит расходов на организацию, включить проверку только для выбранных репозиториев и отслеживать статистику через аналитическую панель. Code Review не одобряет PR самостоятельно – окончательное решение остается за человеком.
Трудно определиться?
За 5 минут пройди тест по подбору профессии
Он подскажет, какое направление больше всего соответствует твоим способностям и предыдущему опыту
Пройти тест