Министерство цифрового развития, информационной политики и массовых коммуникаций Чувашской РеспубликиЧăваш Республикин Цифра аталанăвĕпе информаци политикин тата массăллă коммуникацисен министерстви

Нейросеть от Сбера научили генерировать тексты на чувашском языке

Нейросеть от Сбера научили генерировать тексты на чувашском языке

Команда разработчиков SberDevices представила многоязычную версию нейросети GPT-3 под названием mGPT. Она может генерировать тексты на 61 языке мира, включая чувашский язык.

mGPT - это первая в мире генеративная модель, которая поддерживает значительное количество языков. Нейросеть доступна в двух вариантах: базовой, с 1,3 миллиарда параметров, опубликованной в открытом доступе в облачном хранилище СберДиск, и расширенной, с 13 миллиардами параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.

Причем эта модель может использоваться как просто для создания текста, так и для решения различных задач в области обработки естественного языка.

Например, можно научить автоматизированную систему писать отзывы, комментарии в социальных сетях, определять эмоциональную окраску текста, извлекать из текста имена, фамилии, названия компаний и тому подобное. Модель может также использоваться для улучшения качества распознавания речи, генерации сценариев диалоговых систем и так далее.

«В 2020 году мы представили русскоязычную версию нейросети GPT-3, именно она используется в двух виртуальных ассистентах семейства Салют от Сбера — Джой и Афине. Мы продолжили развивать наши NLP-технологии и представили модель mGPT, поддерживающую более 60 языков, при этом для многих из них ранее генеративных моделей просто не существовало. Это среди прочего станет нашим вкладом в сохранение и развитие языков народов России: mGPT умеет генерировать тексты на чувашском», - прокомментировал CEO SberDevices, вице-президент по новым цифровым поверхностям Салют Сбербанка Денис Филиппов.

Воспользоваться данной системой может любой желающий с минимальными навыками программирования. Для этого нужно зайти на СберДиск и скачать модель mGPT c облачного хранилища.

«Чувашский язык – уникален и достоин быть представленным в сети Интернет во всем своем многообразии. Первые шаги к цифровизации чувашского языка были сделаны в 2020 году, когда чувашский язык был включен в сервис «Яндекс. Переводчик». Разработка Сбера – это новая волна в продвижении чувашского языка как культурного наследия республики», - прокомментировала министр цифрового развития, информационной политики и массовых коммуникаций Чувашской Республики Кристина Майнина.



28 апреля 2022
17:39
Поделиться