Метод наименьших квадратов (МНК) в линейной регрессии позволяет найти такие коэффициенты модели, при которых ошибка между реальными данными и модельными прогнозами оказывается минимальной. 1
Суть метода — для каждой точки на графике измеряют расстояние по оси y до проведённой линии. 2 Вычисляют разницу между фактическим и предсказанным значением зависимой переменной для каждого значения независимой переменной. 2
Если фактическое и предсказанное значение совпадают, то модель предсказала значение идеально. 2 Чем больше разница, тем хуже предсказание модели для этого единственного наблюдения. 2
Разница между фактическими и предсказанными значениями может быть положительной (предсказанное значение меньше фактического) или отрицательной (предсказанное больше фактического). 2 Если просто просуммировать их, то отрицательные и положительные разницы будут компенсировать друг друга. 2 Чтобы этого не происходило, разницу возводят в квадрат. 2
После этого суммируют возведённые в квадрат разницы для всех точек. 2 В результате вычисляют дисперсию остатков регрессии. 2
Проиллюстрировать суть метода можно графически: строят точечный график по данным наблюдений в прямоугольной системе координат (такой точечный график называют корреляционным полем) и пытаются подобрать прямую линию, которая ближе всего расположена к точкам корреляционного поля. 3 Согласно методу наименьших квадратов, линия выбирается так, чтобы сумма квадратов расстояний по вертикали между точками корреляционного поля и этой линией была бы минимальной. 3