Метод Ньютона может быть использован для решения задач оптимизации путём нахождения нуля первой производной либо градиента в случае многомерного пространства. 2
В основе метода лежит использование информации как о первой, так и о второй производных функции. 1 Первая производная (градиент) указывает на направление, в котором функция изменяется сильнее всего, что используется для нахождения точек минимума или максимума. 1
Вторая производная (гессиан) описывает кривизну поверхности функции. 1 Гессиан содержит информацию о том, насколько сильно меняется градиент в каждой точке, и позволяет скорректировать шаг оптимизации с учётом этого изменения. 1
Алгоритм метода Ньютона включает следующие этапы: 1
Для эффективного применения метода Ньютона требуется вычисление гессиана — матрицы вторых производных, что может быть вычислительно дорого и сложно в задачах с большими размерами. 1 Также метод чувствителен к начальной точке: при неудачном выборе начальной точки или на невыпуклых функциях возможна плохая сходимость или даже расходимость. 1