Генеративная нейросеть YandexGPT 3 Pro работает на основе обучения, которое проходит в несколько этапов: 2
- Pretraining. 2 Модель учит структуру языка и запоминает факты о мире. 2 Для обучения используются терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты (токены). 2
- Fine-tuning. 2 Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами. 2 Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса». 2 Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, редакторы, социологи, психологи, филологи. 2
- Продуктовые доработки. 2 Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении. 2
YandexGPT 3 Pro эффективнее решает сложные задачи и лучше понимает контекст беседы по сравнению с YandexGPT 2. 3 Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а ещё — корректнее работает с фактами, даёт более точные и полные ответы и допускает меньше стилистических ошибок. 3