События сегодня

«Яндекс» открыл доступ к своей нейросети для генерации текстов

Яндекс открыл бесплатный доступ к ЯЛМ 100Б — нейросети для генерации и обработки текстов на русском и английском языках. Это самая крупная GPT-подобная модель, опубликованная в открытом доступе, сообщили Sostav в пресс-службе компании. Нейронная сеть предназначена для разработчиков и исследователей со всего мира.

ЯЛМ 100Б содержит 100 миллиардов параметров — больше, чем любая другая модель для русского языка. Языковые модели из семейства ЯЛМ определяют принцип построения текста и порождают новые на основе законов языкознания и своего познания мира. По данным Яндекса, они умеют придумывать идеи для рекламных кампаний, создавать описания товаров и видеоролики, а также генерировать любые тексты (стихи, ответы, поздравления). и т.п.) и классифицировать их, например, по стилю речи.

Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе «Поиск» и «Алиса». Сотрудники службы поддержки отвечают на звонки, используя языковые модели. Также нейросети пишут рекламу и описания сайта (сниппеты) для компании. Технология также используется при подготовке быстрых ответов в поисковой системе.

Петр Попов, генеральный директор Яндекс Технологии:

Для обучения такой большой языковой модели требуются огромные ресурсы, опытные специалисты и годы работы. И для нас важно, чтобы к современным технологиям имели доступ не только крупнейшие ИТ-компании, но и все сообщество исследователей и разработчиков. Делая YaLM 100B общедоступным, мы надеемся, что это даст толчок развитию генеративных нейронных сетей.

Модель обучалась на суперкомпьютерах Яндекса. В процессе работы ЯЛМ 100Б обработал около 2 ТБ текстов из открытых наборов данных (наборов данных) и Интернета на английском и русском языках. Модель предоставляется под открытой лицензией Apache 2.0 и доступна на GitHub.

Ранее команда SberDevices разрабатывала сервисы по переписыванию и сокращению текстов на русском языке. Технологии работают на основе генеративных моделей нейронных сетей из коллекции ruGPT-3 & family. Их можно использовать для любых целей, связанных с обработкой текста: в копирайтинге, новостных публикациях и для создания рекламных материалов. Разработчики открыли доступ к пробным демоверсиям на торговой площадке AI Services в SberCloud ML Space.

Похожие статьи

Кнопка «Наверх»