AlexNet получила признание в области компьютерного зрения благодаря успеху в конкурсе ImageNet Large Scale Visual Recognition Challenge 2012, где задачей было классифицировать изображения на тысячи различных категорий. cyberleninka.ru
Сеть значительно превзошла предыдущие модели, достигнув ошибки топ-5 в 15,3%, что более чем на 10,8 процентных пункта выше, чем у занявшей второе место. en.wikipedia.org
Некоторые причины успеха AlexNet:
- Глубокая архитектура. cyberleninka.ru Модель состоит из восьми слоёв: пяти конволюционных и трёх полностью связанных. dzen.ru Эти слои автоматически и адаптивно обучаются пространственным иерархиям признаков на основе входных изображений. dzen.ru
- Использование выпрямленных линейных блоков (ReLU) в качестве функций активации. dzen.ru Она позволяет ускорить обучение без существенных проблем с переподгонкой. dzen.ru
- Применение графических процессоров (GPU). en.wikipedia.org dzen.ru Для обучения модели авторы использовали два графических процессора GTX 580, что продемонстрировало важность и эффективность использования графических процессоров в глубоком обучении. dzen.ru