Компания ABBYY открыла доступ к своей библиотеке разработок машинного обучения для искусственного интеллекта NeoML – библиотеку машинного обучения с открытым кодом, доступную на платформе GitHub. Библиотека поддерживает современные методы как глубокого, так и классического машинного обучения, которые работают в облачной среде, на десктопах и мобильных платформах. NeoML оптимизирован для работы на процессорах CPU и может применяться для самого широкого круга сценариев.
Библиотека уже поддерживает языки программирования С++, Java, Objective C, а в ближайшее время ABBYY добавит к ним Python. Нейросети библиотеки поддерживают до 100 слоев, а для классического машинного обучения доступны более 20 алгоритмов. По результатам внутренних тестов, скорость библиотеки на задачах обработки изображений превышает аналоги на 15-20%. Благодаря поддержке открытого стандарта ONNX, библиотека может использовать модели из других фреймворков, позволяя разработчикам задействовать оптимальную комбинацию инструментов. Стандарт создан и поддерживается совместно Microsoft, Facebook и другими партнерами как проект с открытым исходным кодом. NeoML разрабатывается в Microsoft Visual Studio.
С помощью библиотеки NeoML разработчики могут дополнять свои приложения различными возможностями на основе технологий искусственного интеллекта: компьютерного зрения и обработки естественного языка. Модели, созданные с помощью алгоритмов NeoML, решают задачи идентификации, классификации, семантической сегментации, прогнозирования и другие задачи, актуальные для бизнеса. Например, банки могут разрабатывать, обучать и применять модели для предсказания спроса на кредиты, а «зеленые» компании – для контроля состояния окружающей среды.
Гендиректор «ABBYY Россия» Дмитрий Шушкин считает, что публикация наработок компании позволит ускорить развитие продуктов фирмы благодаря обратной связи от разработчиков и расширит сферу применения этих технологий.
«Все больше компаний, включая таких гигантов, как Microsoft, Google, Apple, Facebook активно делятся своими решениями с open source-сообществом. Сегодня ABBYY тоже открывает доступ к актуальным инструментам машинного обучения, публикуя библиотеку NeoML на GitHub, – комментирует Иван Ямщиков, AI-евангелист ABBYY. – Разработчики ABBYY используют NeoML для задач компьютерного зрения и обработки естественного языка при работе со структурированными и неструктурированными документами. Преимущества библиотеки — скорость работы обученных моделей и её кросс-платформенность».
«Один из главных приоритетов для Microsoft – развитие open source экосистемы, в особенности – в сфере искусственного интеллекта, – говорит Константин Гольдштейн, ведущий эксперт по стратегическим технологиям Microsoft в России. – Мы рады поддержать нашего партнера ABBYY, ведущего разработчика ИИ-решений в России и в мире, на этом важном этапе. NeoML откроет целый ряд возможностей по использованию нейросетей в бизнес-сценариях. Поддержка стандарта ONNX и размещение проекта на GitHub позволят сделать библиотеку глобально доступной и создать вокруг нее обширную экосистему разработчиков».
Доступ к исходным кодам можно получить на официальном репозитории проекта на GitHub по ссылке. Представители бизнеса, разработчики и data scientist-ы во всем мире могут принять участие в совместной разработке, предложив идеи по улучшению кода. NeoML можно использовать на Windows, Linux, macOS, iOS и Android. Библиотека поддерживает процессоры CPU и GPU. Открытый код фреймворка предоставляется под лицензией Apache 2.0 License.
Ранее искусственный интеллект, разработанный ABBYY, использовался в большом проекте по оцифровке исторических документов Большого театра. С его помощью было оцифровано и систематизировано более 268 тысяч различных документов и фотографий. Все данные были загружены в электронную базу музея театра, разработанную компанией «Камис».