Чтобы научить нейросетевые языковые модели понимать то, о чём они «пишут», можно предпринять следующие шаги:
- Обучить модель запоминать контекст. 15 Для этого используют обучающие данные, например, архив Википедии, художественные тексты и другие виды текстов. 15 При обучении из собранных данных берут фрагмент текста и добавляют к нему специальные слова, которые обозначают начало и конец фрагмента. 15 Модель производит сложные преобразования над фрагментом и возвращает таблицу чисел. 15 Зная весь фрагмент целиком, для каждого контекста можно узнать наиболее вероятное продолжение. 1 Это позволяет сравнить соответствующие ячейки таблицы, которую выдала модель, со 100% (максимальной вероятностью) и на основе отклонения от правильного ответа поднастроить модель. 1
- Обучить модель следовать инструкциям. 15 Для этого собирается отдельный обучающий набор, содержащий пары «команда — ответ». 15
- Сформулировать задание (промпт). 34 Это подробное описание задания или действия, которые должна выполнить нейросеть. 3 Чем точнее промпт описывает, что нужно сделать, тем лучше модель поймёт, что ей нужно делать. 4
Также можно обучить модель работать не только с текстом, но и с другими привычными людям типами данных, например, с изображениями. 2 Для этого используют кодировщик изображений, который кодирует изображение в пространство векторов, а затем к большой языковой модели добавляют адаптер, который сращивает две модели между собой. 2 В датасетах для адаптера содержатся только пары «картинка + подпись». 2 На втором этапе используют семплы в виде «картинка + диалог по картинке» (чередующиеся вопросы и ответы). 2 Языковую модель или совсем не учат, или учат незначительно, потому что она и так неплохо обучена под свою задачу — писать текст и вести диалоги. 2 Её достаточно лишь немного дообучить, чтобы она научилась извлекать информацию из изображений от адаптера. 2
Выбор метода зависит от конкретной задачи и доступных ресурсов.