Многослойный перцептрон Румельхарта считается более эффективным, чем классический перцептрон Розенблатта, благодаря ряду особенностей: ru.wikipedia.org wiki.loginom.ru
- Использование нелинейной функции активации (как правило, сигмоидальной). ru.wikipedia.org
- Наличие более чем одного обучаемого слоя (как правило, два или три). ru.wikipedia.org
- Сигналы, поступающие на вход и получаемые с выхода, не двоичные, а могут кодироваться десятичными числами, которые нужно нормализовать так, чтобы значения были на отрезке от 0 до 1. ru.wikipedia.org
- Допускается произвольная архитектура связей (в том числе и полносвязные сети). ru.wikipedia.org
- Ошибка сети вычисляется не как число неправильных образов после итерации обучения, а как некоторая статистическая мера невязки между нужным и получаемым значением. ru.wikipedia.org
- Обучение проводится не до отсутствия ошибок после обучения, а до стабилизации весовых коэффициентов при обучении или прерывается ранее, чтобы избежать переобучения. ru.wikipedia.org
Эти особенности позволяют улучшить способность к обобщению, то есть к правильным реакциям на стимулы, которым перцептрон не обучался. ru.wikipedia.org