Аугментация данных помогает бороться с переобучением моделей, расширяя обучающий набор путём создания новых примеров на основе существующих данных. na-journal.ru
Некоторые механизмы, как это происходит:
- Увеличение разнообразия контекстов, в которых модель «видит» объекты целевых классов. habr.com Например, в задаче по классификации изображений нейросеть учится распознавать объекты по ограниченному набору признаков, специфичных для примеров из обучающей выборки. habr.com Аугментация помогает имитировать вариативность внешнего вида и окружения объектов, генерируя примеры с различными искажениями, ракурсами, фонами. habr.com В результате модель учится распознавать объекты в более широком диапазоне контекстов, что улучшает её точность и переносимость в отношении реальных данных. habr.com
- Вынуждение модели учиться более общим, семантически значимым признакам, игнорируя незначительные артефакты исходных данных. habr.com
- Обучение модели быть устойчивой к различным искажениям и помехам, которые присутствуют в реальных условиях. habr.com Обучаясь на аугментированных примерах, модель учится быть устойчивой к таким трансформациям входных данных, повышается её робастность и переносимость. habr.com