«Сбербанк» представил нейросеть GigaChat, которая способна отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и изображения на основе описаний в рамках единого контекста. В отличие от иностранных сетей представленная нейросеть более грамотно общается на русском языке. На первом этапе GigaChat доступна в режиме тестирования по приглашениям.
Архитектура GigaChat основана на ИИ-платформе NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающей различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. Такая комбинация обеспечивает способность GigaChat поддерживать беседу, писать тексты, отвечать на фактологические вопросы, а имеющаяся в ансамбле модель Kandinsky 2.1 делает возможным создание изображений по их текстовому описанию.
Команда «Сбера» сообщила, что входящая в состав NeONKA модель ru-GPT 3.5 с 13 млрд параметров будет выложена в открытый доступ в целях ускорения развития сообщества Open Source и технологий в области искусственного интеллекта, что позволит студентам, учёным и разработчикам использовать её в своей работе.
Возможности новой ИИ-модели будут задействованы в виртуальном ассистенте «Салют» и прочих продуктах «Сбера». Сообщается, что первую версию платформы NeONKA оптимизировали по размеру и скорости для применения в высоконагруженных сервисах.
В разработке модели принимают участие команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов. Обучение нейросети выполнялось на суперкомпьютере Christofari Neo. В настоящее время модель работает в режиме закрытой бета-версии. Для участия в её бесплатном тестировании необходимо вступить в закрытое сообщество в Telegram-канале. В дальнейшем GigaChat будет доступен через облачное API для разработчиков и бизнеса.