Новый релиз включает сразу несколько языковых моделей, направленных на разные сложные задачи. Среди главных особенностей Gemini 2.5 – возможность рассуждать и писать код, показывая «лучшие результаты в кодировании, математике и точных науках». По информации Google, новая модель демонстрирует лучшие показатели среди других моделей в специализированных бенчмарках и демонстрирует значительный отрыв на LMArena, заняв уверенное первое место в сравнении с моделями Grok, ChatGPT 4.5 и DeepSeak.

Google выпустила большую языковую модель Gemini 2.5: что она умеет?

Google позиционирует Gemini 2.5 как ответ на модели типа o1 от OpenAI, подчёркивая её потенциал для будущих ИИ-агентов, способных выполнять задачи автономно.

Флагманской языковой моделью Gemini 2.5 стала версия с приставкой Pro — это мультимодальный алгоритм со встроенными возможностями «мышления», позволяющими анализировать информацию, делать логические выводы и решать сложные задачи, учитывая контекст. Google утверждает, что все будущие модели семейства Gemini 2.5 будут обладать такими способностями.

По сравнению с предыдущими моделями, вроде Gemini 2.0 Flash Thinking, новая версия демонстрирует значительный прогресс. Gemini 2.5 Pro лидирует в тестах LMArena (предпочтения пользователей), AIME 2025 (математика) и GPQA diamond (наука), а также занимает первое место с результатом 18,8% в тесте Humanity’s Last Exam, оценивающим знания и рассуждения на уровне человеческого предела.

В области программирования модель показывает скачок по сравнению с Gemini 2.0. Например, в тесте SWE-Bench Verified новая ИИ-модель набрала 63,8%, обойдя OpenAI o3-mini и DeepSeek R1, хотя уступила Claude 3.7 Sonnet от Anthropic (70,3%). А в тесте Aider Polyglot (редактирование кода) она показала 68,6%, превзойдя ведущие модели конкурентов.

Gemini 2.5 Pro поддерживает контекстное окно в 1 млн токенов. При этом разработчики обещают увеличить этот лимит до 2 млн. Это позволит модели обрабатывать огромные объёмы данных, включая текст, аудио, изображения, видео и целые репозитории кода.

Модель Gemini 2.5 Pro уже доступна в Google AI Studio в приложении Gemini для пользователей подписки Gemini Advanced.