Системы памяти в современных ИИ-агентах работают на основе разных типов памяти, которые позволяют сохранять контекст, обучаться и адаптироваться, демонстрировать прогнозное и проактивное поведение. vk.com
Краткосрочная память (рабочая, контекстное окно) временно сохраняет недавние взаимодействия или данные для немедленного анализа. vk.com
Долгосрочная память хранит знания, факты и опыт в течение длительного времени. vk.com Она включает в себя: vk.com
- Эпизодическую память. vk.com www.geeksforgeeks.org Запоминает конкретные события, случаи или разговоры. vk.com Позволяет агенту вспоминать, извлекать уроки и адаптироваться на основе предыдущих эпизодов. www.geeksforgeeks.org
- Семантическую память. dzen.ru vk.com Хранит общие знания, такие как правила, факты или экспертные знания в определённой области. vk.com Охватывает информацию о пользователе или контексте использования. dzen.ru
- Процедурную память. habr.com vk.com Кодирует приобретённые навыки и сложные рутины, часто через обучение с подкреплением или многократное воздействие. vk.com
Один из примеров работы системы памяти — архитектура Memp, которая функционирует в трёх непрерывных циклах: построение, извлечение и обновление памяти. habr.com Память формируется на основе прошлых «траекторий» агента — его шагов при выполнении задач. habr.com Эти траектории могут храниться в подробном виде или преобразовываться в абстрактные сценарии. habr.com
Принцип работы векторной памяти в контексте LLM-агента: dzen.ru
- Индексирование знаний. dzen.ru Все важные тексты (факты, разделы документов, сообщения диалога) заранее конвертируются в эмбеддинги и сохраняются в векторное хранилище. dzen.ru
- Поиск по запросу. dzen.ru Когда приходит новый пользовательский запрос, сначала он тоже преобразуется в embedding — вектор запроса. dzen.ru
- Извлечение контекста. dzen.ru Производится семантический поиск в базе эмбеддингов — выбираются наиболее близкие к запросу векторы и соответствующие им тексты/факты. dzen.ru
- Формирование расширенного prompt. dzen.ru Извлечённые по смыслу фрагменты добавляются к истории диалога или в системное сообщение, тем самым расширяя контекстное окно актуальной информацией. dzen.ru
- Генерация ответа. dzen.ru LLM-модель получает на вход не только сам вопрос, но и подобранный по смыслу контекст, и генерирует более точный и информированный ответ. dzen.ru