Некоторые ключевые достижения в области рассуждения в больших языковых моделях (LLM):
Техника промптинга CoT Chain-of-Thoughts («цепочка мыслей»). llmstudio.ru Позволяет вызывать пошаговые процессы человекообразного рассуждения во время инференса без дополнительного обучения. llmstudio.ru Этот подход значительно улучшает точность рассуждений предварительно обученных LLM. llmstudio.ru
Обучение с подкреплением. www.chatpaper.ai Позволяет автоматически генерировать траектории рассуждения высокого качества с помощью алгоритмов проб и ошибок. www.chatpaper.ai Такой подход расширяет возможности рассуждения LLM за счёт предоставления большего объёма обучающих данных. www.chatpaper.ai
Использование данных, аннотированных человеком. llmstudio.ru Такие данные помогают LLM, изначально обученным на общих текстовых корпусах, соответствовать сложным человеческим ценностям и этическим соображениям. llmstudio.ru Также они позволяют тонкой настраивать модели для конкретных задач. llmstudio.ru
Визуализация промежуточных шагов рассуждения. postnauka.org После того как DeepSeek внедрили такую визуализацию, другие крупные модели тоже начали показывать ход генерации ответа. postnauka.org
Применение подхода LLM Programs. habr.com Задача разбивается на последовательность логически независимых шагов, каждый из которых решается отдельно. habr.com Такой подход позволяет увеличить доступный контекст, повысить интерпретируемость процесса и сократить требования к дообучению. habr.com
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.