Градиентный спуск — это эвристический алгоритм, который выбирает случайную точку, рассчитывает направление скорейшего убывания функции (пользуясь градиентом функции в данной точке), а затем пошагово рассчитывает новые значения функции, двигаясь в выбранную сторону. 1
Алгоритм поиска минимума функции с помощью градиентного спуска: 5
Градиент — это вектор, показывающий направление, в котором функция многих переменных быстрее всего возрастает или падает. 1
Размер одного шага можно настроить, этот параметр называется «скоростью обучения». 1 Если на каком-то этапе разность между старой точкой (до шага) и новой снижается ниже предела, считается, что минимум найден, алгоритм завершён. 1
Важно отметить, что градиентный спуск не гарантирует нахождения глобального минимума. 4 Он может найти локальный минимум и остановиться на нём, если выполняются пороговые условия. 4 Это зависит от таких факторов, как форма функции, первоначально выбранные случайные параметры, скорость обучения и так далее. 4