Некоторые основные архитектуры нейросетей, которые используются для обнаружения объектов:
- U-NET. 12 Классический вариант свёрточной нейронной сети для сегментации изображений. 1 Суть в том, чтобы исходное изображение сжать, а затем разжать в исходный размер. 1 По мере свёртки и развёртки исходные значения пикселей изображения переводятся в значения классов, к которым принадлежит каждый пиксель изображения. 1
- Selective Search. 12 Нейронная сеть, использующаяся для задач классификации. 1 Является первым вариантом, придуманным для таких целей. 1
- RCNN. 2 Архитектура нейросети, в которой применяются технологии Selective Search и свёрточные нейронные сети. 2 На выходе получается вектор классификации, где указываются объекты, которые находятся в данной прямоугольной области, а также указывается смещение области, для лучшего выделения объекта. 2
- SPP. 2 Вариант RCNN-сети, где местами поменяны свёрточная часть нейросети и Selective Search. 2 Это позволяет последнему работать не с исходным изображением, а с картой признаков, построенной свёрточной сетью, ускоряя свою работу в 10 раз. 2
- Fast-RCNN. 2 Нейронная сеть, схожая по алгоритму с SPP, но перед свёрточными слоями все прямоугольные области приводятся к одинаковому размеру, что ускоряет сеть в 2 раза. 2
- YOLO. 14 Вариант архитектуры, когда изображение проходит через многослойную свёрточную нейронную сеть, строя карту признаков, на основе которых выделяются объекты. 1 Для связи слоёв свёртки используются соединения с предыдущими слоями, что повышает точность работы. 1 Выходов данной сети несколько, для обнаружения объектов различных размеров. 1