Алгоритм YOLO (You Only Look Once) для обнаружения объектов работает за один проход по изображению. timeweb.cloud ru.macgence.com В отличие от традиционных методов, которые применяют обнаружение в нескольких областях изображения, YOLO обрабатывает всё за один раз. www.geeksforgeeks.org
Процесс включает несколько этапов: www.geeksforgeeks.org
- Ввод изображения. www.geeksforgeeks.org Размер входного изображения изменяется до фиксированного размера (например, 448 x 448) для обеспечения согласованной обработки. www.geeksforgeeks.org
- Разделение сетки. www.geeksforgeeks.org Изображение разделяется на сетку (например, 7 x 7). www.geeksforgeeks.org Каждая ячейка сетки отвечает за предсказание объектов, попадающих в неё. www.geeksforgeeks.org
- Извлечение объектов. www.geeksforgeeks.org С помощью свёрточных слоёв из изображения извлекаются объекты. www.geeksforgeeks.org Эти объекты используются для прогнозирования ограничивающих рамок и вероятностей классов. www.geeksforgeeks.org
- Прогнозирование ограничивающих рамок. www.geeksforgeeks.org Каждая ячейка сетки предсказывает несколько ограничивающих рамок. www.geeksforgeeks.org Каждая ограничивающая рамка состоит из пяти компонентов: x, y (координаты центра), w, h (ширина и высота) и показатель достоверности. www.geeksforgeeks.org
- Предсказание класса. www.geeksforgeeks.org Каждая ячейка сетки предсказывает вероятности для каждого класса (например, человека, автомобиля, собаки) присутствующего объекта. www.geeksforgeeks.org
- Комбинирование прогнозов. www.geeksforgeeks.org YOLO объединяет прогнозы ограничивающей рамки и вероятности классов для создания окончательного списка обнаруженных объектов. www.geeksforgeeks.org
- Подавление без максимального значения. www.geeksforgeeks.org Для обработки нескольких обнаружений одного и того же объекта YOLO применяет подавление, которое удаляет избыточные ограничивающие рамки на основе их достоверных оценок. www.geeksforgeeks.org
На выходе YOLO возвращает список объектов, координаты рамок, где они находятся, и уровень уверенности в каждом предсказании — насколько точно нейросеть думает, что попала в цель. timeweb.cloud