Новый режим исследует несколько решений одновременно и продемонстрировал выдающийся результат — 45,1% на тесте абстрактного рассуждения ARC-AGI-2, в то время как большинство моделей не достигают уровня в 30%.
Компания Google представила режим Deep Think для нейросети Gemini 3 — особый формат работы, предоставляющий модели больше времени на размышления и позволяющий решать сложные математические, научные и логические задачи, с которыми не справляются стандартные ИИ. Эта функция доступна пользователям тарифа Google AI Ultra в приложении Gemini.
Главное отличие Deep Think от обычного режима заключается в параллельном рассуждении. Стандартные языковые модели формируют ответ последовательно: они выбирают следующее слово, основываясь на предыдущих, двигаясь от начала к концу без возможности «передумать». Если на каком-либо этапе модель сделала ошибочное предположение, весь дальнейший ответ строится на этой ошибочной основе.
Deep Think функционирует иначе: модель обрабатывает несколько гипотез одновременно, исследует различные пути решения и выбирает наиболее обоснованный вариант. Это похоже на то, как человек решает сложную задачу, пробуя несколько подходов, отбрасывая неэффективные варианты, возвращаясь к развилкам и находя правильный путь. Такой подход критичен для задач, где одна ошибка в логической цепочке может привести к полностью неверному выводу.
На тесте Humanity’s Last Exam (в переводе «последний экзамен человечества»), который включает в себя набор крайне сложных задач, созданных для того, чтобы «завалить» даже лучшие ИИ — Gemini 3 Deep Think показала 41.0% без применения дополнительных инструментов. Это лучший результат среди всех существующих моделей.
Еще более впечатляющее достижение на ARC-AGI-2 тесте абстрактного рассуждения и обобщения. На этом тесте модель набрала рекордные 45.1% с возможностью написания кода. Большинство современных ИИ не преодолевают планку в 20–30% на этом тесте. ARC-AGI-2 проверяет не запомненные факты, а способность к логике и переносу знаний на новые ситуации — именно это отличает настоящий интеллект от продвинутого автодополнения.

Gemini 3 Deep Think основан на модели Gemini 2.5 Deep Think — варианте, который недавно достиг золотого стандарта на Международной математической олимпиаде и в финале Международного чемпионата по программированию. Эти соревнования считаются одними из самых сложных интеллектуальных испытаний: задачи требуют многоступенчатого рассуждения, креативных подходов и глубокого понимания математики или алгоритмов.
Deep Think не заменяет стандартный режим, а дополняет его для специфических сценариев. Если требуется быстрый ответ на простой вопрос, стандартный Gemini справится мгновенно. Однако если задача требует глубокого анализа, например, решить нетривиальное уравнение, изучить сложную научную проблему или написать алгоритм для редкого случая — Deep Think обеспечит более точный и обоснованный результат. Это дополнение особенно полезно для ученых, работающих с математическими моделями, студентов технических вузов, решающих олимпиадные задачи, и разработчиков, занимающихся алгоритмическими головоломками. В общем, это актуально для тех, кому важнее качество рассуждений, чем скорость генерации текста.
Также сообщается, что Amazon анонсировала три ИИ-агента, способных писать код в течение суток. Подробности в статье.
Фото: hi-tech.mail.ru

