Некоторые ключевые модели глубокого обучения, представленные в PyTorch Vision:
- Для классификации изображений. 3 ResNet, VGG и DenseNet. 13 Эти модели обучены на масштабных наборах данных, например ImageNet. 3
- Для обнаружения объектов. 3 Faster R-CNN, Mask R-CNN и RetinaNet. 3 Такие модели способны обнаруживать и локализовать несколько объектов внутри изображения. 3
- Для семантической сегментации. 3 DeepLabV3 и FCN (Fully Convolutional Network). 3 Эти модели обеспечивают точную классификацию на уровне пикселей и подходят для таких приложений, как медицинская визуализация, дистанционное зондирование и автономное вождение. 3
- Поддержка Vision Transformers (ViT). 3 Модуль torchvision.models.vision_transformer предлагает предварительно обученные модели ViT, которые обеспечивают высокую производительность в широком диапазоне задач. 3