Дилемма смещения-дисперсии — это конфликт при попытке одновременно минимизировать два источника ошибки, которые мешают алгоритмам обучения с учителем делать обобщение за пределами тренировочного набора. 2
Смещение — это погрешность оценки, возникающая в результате ошибочного предположения в алгоритме обучения. 2 В результате большого смещения алгоритм может пропустить связь между признаками и выводом (недообучение). 2
Дисперсия — это ошибка чувствительности к малым отклонениям в тренировочном наборе. 2 При высокой дисперсии алгоритм может как-то трактовать случайный шум в тренировочном наборе, а не желаемый результат (переобучение). 2
Примеры алгоритмов машинного обучения с низким смещением: деревья решений, k-ближайших соседей и машины опорных векторов. 1 Примеры алгоритмов машинного обучения с высоким смещением: линейная регрессия, линейный дискриминантный анализ и логистическая регрессия. 1
Примеры алгоритмов машинного обучения с низкой дисперсией: линейная регрессия, линейный дискриминантный анализ и логистическая регрессия. 1 Примеры алгоритмов машинного обучения с высокой дисперсией: деревья принятия решений, k-ближайших соседей и машины опорных векторов. 1