Автоматическое обучение Алисы на массиве текстовых данных происходит через использование генеративных текстовых моделей Яндекса, например YandexGPT 5 Pro и YandexGPT 5 Lite. 1
YandexGPT 5 Pro — флагманская языковая модель, интегрированная в сервис «Алиса Про». 1 Архитектура оптимизирована для работы с длинными текстами — до 200 страниц за один запрос. 1 Модель позволяет, например:
YandexGPT 5 Lite — облегчённая модель, доступная для некоммерческого и коммерческого использования. 1 Включает 8 миллиардов параметров и поддерживает контекст длиной до 32 000 токенов. 1 Модель демонстрирует уверенные результаты в задачах классификации, анализа текстов, генерации ответов в нужном формате. 1
Также Алиса может самостоятельно выделять интересующую разработчика информацию из текста пользователя с использованием именованных сущностей (имен, фамилий, названий городов и т. д.). 2