Разница между Zero-shot и Few-shot обучением в современных языковых моделях заключается в количестве примеров, которые используются для обучения: habr.com knowledge.deck.no
- Zero-shot — модель выполняет задачи без каких-либо примеров обучения. habr.com Она делает это за счёт обобщённых знаний, полученных во время предобучения. habr.com Zero-shot хорошо работает на обобщённых задачах (классификация, генерация, перевод). habr.com Однако у такого подхода ограниченная точность, особенно в узкоспециализированных доменах. habr.com
- Few-shot — входная последовательность включает несколько примеров. habr.com Модель сравнивает паттерны в примерах и адаптирует вероятностное распределение. habr.com Это создаёт динамическую адаптацию к новой задаче без дообучения. habr.com Few-shot эффективен в случаях, когда доступно мало размеченных данных. habr.com
Таким образом, Zero-shot подходит для задач, требующих общих знаний, а Few-shot — для ситуаций, когда нужно научить модель новому концепту или когда требуется точный формат вывода. neptune.ai