Нейросеть от Сбера научили генерировать тексты на чувашском языке
Команда разработчиков SberDevices представила многоязычную версию нейросети GPT-3 под названием mGPT. Она может генерировать тексты на 61 языке мира, включая чувашский язык.
mGPT - это первая в мире генеративная модель, которая поддерживает значительное количество языков. Нейросеть доступна в двух вариантах: базовой, с 1,3 миллиарда параметров, опубликованной в открытом доступе в облачном хранилище СберДиск, и расширенной, с 13 миллиардами параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.
Причем эта модель может использоваться как просто для создания текста, так и для решения различных задач в области обработки естественного языка.
Например, можно научить автоматизированную систему писать отзывы, комментарии в социальных сетях, определять эмоциональную окраску текста, извлекать из текста имена, фамилии, названия компаний и тому подобное. Модель может также использоваться для улучшения качества распознавания речи, генерации сценариев диалоговых систем и так далее.
«В 2020 году мы представили русскоязычную версию нейросети GPT-3, именно она используется в двух виртуальных ассистентах семейства Салют от Сбера — Джой и Афине. Мы продолжили развивать наши NLP-технологии и представили модель mGPT, поддерживающую более 60 языков, при этом для многих из них ранее генеративных моделей просто не существовало. Это среди прочего станет нашим вкладом в сохранение и развитие языков народов России: mGPT умеет генерировать тексты на чувашском», - прокомментировал CEO SberDevices, вице-президент по новым цифровым поверхностям Салют Сбербанка Денис Филиппов.
Воспользоваться данной системой может любой желающий с минимальными навыками программирования. Для этого нужно зайти на СберДиск и скачать модель mGPT c облачного хранилища.
«Чувашский язык – уникален и достоин быть представленным в сети Интернет во всем своем многообразии. Первые шаги к цифровизации чувашского языка были сделаны в 2020 году, когда чувашский язык был включен в сервис «Яндекс. Переводчик». Разработка Сбера – это новая волна в продвижении чувашского языка как культурного наследия республики», - прокомментировала министр цифрового развития, информационной политики и массовых коммуникаций Чувашской Республики Кристина Майнина.