Команда разработчиков «Сбера» объявила о создании нового поколения нейросетевых моделей Kandinsky 5.0, предназначенных для генерации и редактирования изображений и видеороликов. В линейку ИИ-решений входит четыре модели: три работают с изображениями, четвертая специализируется на обработке видео.

«Сбербанк» выпустил обновлённое семейство ИИ-моделей для генерации медийного контента.

Главные особенности семейства Kandinsky 5.0 включают поддержку русского культурного контекста, возможность создавать реалистичные картинки и видеоролики, а также понимание физических процессов и кинематографических приемов. Модели способны эффективно взаимодействовать с русскоязычными запросами и воспроизводить надпись как на кириллице, так и на латинице.

Само семейство состоит из четырех моделей:

- Kandinsky 5.0 Image Lite генерирует изображение высокого разрешения размером вплоть до 1280×768 и 1024×1024 пикселей.

- Image Editing используется для качественного редактирования картинок большого формата.

- Video Pro создает видеоролики продолжительностью до 10 секунд в высоком разрешении 1280×768 пикселей с частотой кадров 24 FPS.

- Video Lite формирует короткие ролики стандартного разрешения 768×512 пикселей, доступные для запуска на домашних компьютерах с памятью видеокарты всего лишь 12 гигабайт.

Все четыре модели воспринимают запросы как текстовые описания, так и загружаемые изображения. Во многом успех моделей основан на тщательном подборе тренировочных данных, содержащих сбалансированную композицию и стилистику, соответствующую российским эстетическим нормам.

Для тестирования возможностей новых моделей «Сбера» достаточно установить приложение GigaChat на устройстве с Android, посетить сайт giga.chat либо воспользоваться возможностями интеграции в мессенджеры Telegram и Max. Приложения предоставляются абсолютно бесплатно.