Метод LIME (Local Interpretable Model-agnostic Explanations) позволяет объяснять предсказания модели машинного обучения для отдельных экземпляров данных. dzen.ru
Суть подхода — создание упрощённой, легко интерпретируемой модели в окрестности конкретного тестового примера. dzen.ru habr.com Для этого LIME манипулирует входными данными, создавая серию искусственных данных, содержащих только часть оригинальных атрибутов. dzen.ru
Принцип работы: telegra.ph
- Выбор исходной точки. telegra.ph Это может быть любой пример (например, строка данных для табличных данных, изображение, текст и т. д.), для которого было сделано предсказание сложной модели. telegra.ph
- Генерация возмущённых примеров. telegra.ph Возмущения создаются путём внесения небольших изменений в исходные данные. telegra.ph
- Взвешивание примеров. telegra.ph Каждый возмущённый пример получает вес, основанный на его близости к исходной точке. telegra.ph
- Запись предсказаний. telegra.ph Эти предсказания показывают, как модель реагирует на изменения в данных. telegra.ph
- Обучение интерпретируемой модели. telegra.ph Результаты предсказаний вместе с соответствующими весами и исходными данными возмущённых примеров используются для обучения интерпретируемой модели. telegra.ph
Результаты LIME являются локальными, то есть они объясняют предсказание модели для конкретного примера или наблюдения, а не для всего набора данных. telegra.ph