Некоторые основные трудности при интерпретации результатов машинного обучения:
- Недостаточное понимание алгоритма. tproger.ru Особенно сложно работать с нейросетями из-за множества параметров. tproger.ru Если не знать, как алгоритм выводит результат, нельзя быть уверенным, что он не выводит несуществующие корреляции между переменными. tproger.ru
- Плохое понимание исходных данных. tproger.ru Распространённые затруднения — ошибки в сборе данных, например, квантования, неточности считывания и использование замещающих переменных. tproger.ru
- Искажения в исходных данных. www.geeksforgeeks.org Они могут привести к созданию предвзятых моделей, поддерживающих неравенство. www.geeksforgeeks.org Неспособность обнаружить аномалии также может снизить точность прогнозирования. www.geeksforgeeks.org
- Игнорирование пропущенных значений. www.geeksforgeeks.org Эти значения могут отсутствовать из-за повреждения данных или сбоя при записи данных. www.geeksforgeeks.org Игнорирование пропущенных значений может привести к смещению и неточным прогнозам. www.geeksforgeeks.org
- Переобучение. bigdataschool.ru Модель обучается на смещённых или слишком больших объёмах обучающих данных. bigdataschool.ru Переобучение негативно влияет на производительность модели после развёртывания. bigdataschool.ru
- Недообучение. bigdataschool.ru Модель обучается с такими данными, которые заставляют её устанавливать неоднозначную связь между входными и выходными переменными. bigdataschool.ru
- Несоответствующие фичи. bigdataschool.ru Когда в обучающем датасете слишком много нерелевантных фичи или чрезмерно связанных друг с другом предикторов, система машинного обучения может не дать желаемых результатов. bigdataschool.ru
Кроме того, методы интерпретации результатов машинного обучения могут иметь свои ограничения и не всегда давать полную картину того, как работает модель. 4brain.ru Также не все модели могут быть легко интерпретированы, например, нейронные сети. 4brain.ru