Корпорация Google открыла доступ к бета-версии нейросети Gemini 1.5 Pro для всех пользователей. За один раз новая платформа ИИ способна обработать до часа видео, 11 часов аудио, кодовые базы с более чем 30 тыс. трок кода или более 700 тыс. слов. В ходе исследования Google также успешно протестировала обработку до 10 млн токенов.
Ведущий научный сотрудник Google DeepMind Джефф Дин рассказал о проделанной работе по запуску работы нейросети Gemini 1.5 Pro для пользователей: «Сначала мы будем постепенно подключать людей к API, а затем наращивать его. Тем временем разработчики могут опробовать Gemini 1.5 Pro в пользовательском интерфейсе AI Studio прямо сейчас».
Стоит отметить, что Gemini 1.5 Pro работает со стандартным контекстным окном на 128 000 токенов, хотя, как сообщается, обрабатываемый объём информации можно увеличить до 1 млн токенов.
Gemini 1.5, использующая архитектуру Transformer и MoE, сочетает в себе сильные стороны обеих моделей. Gemini 1.5 Pro отлично справляется с различными задачами, такими как анализ исторических документов, например, в расшифровке стенограммы миссии «Аполлон-11». Нейросеть способна не только анализировать большие блоки данных, но и быстро находить определённый фрагмент текста внутри них. Также Gemini 1.5 эффективно обрабатывает большие «куски» кода. В интерфейсе AI Studio нейросеть сейчас доступна с ограничением в 20 запросов в день.
В тесте Needle In A Haystack (NIAH) нейросеть достигает 99% успеха в обнаружении конкретных фактов в длинных текстах. А способность учиться в конкретных условиях, продемонстрированная в бенчмарке Machine Translation from One Book (MTOB), делает Gemini 1.5 одним из лидеров в способности к адаптивному обучению.