Zero-shot подход (обучение без примеров) предполагает, что модель выполняет новую задачу без обучающих примеров, относящихся к этой конкретной задаче. vc.ru Преимущества:
Недостатки:
- Недостаток конкретизации. vc.ru Zero-shot демонстрирует эффективность, пока задача соответствует уже встроенным паттернам. vc.ru При выходе за пределы этих паттернов модель может формировать обобщённые или расплывчатые ответы. vc.ru
- Инструкция как уязвимость. vc.ru Поскольку zero-shot зависит от структуры запроса, он уязвим к нечётким, неоднозначным или неполным формулировкам. vc.ru
One-shot подход (обучение на одном примере) предполагает, что модели даётся только один пример. systems-analysis.ru Преимущества:
- Адаптация в динамических условиях. {9-host} Модели могут быстро адаптироваться без необходимости полной переобучения на новых данных. {9-host}
- Эффективность. {9-host} One-shot использует врождённую способность человека распознавать закономерности и принимать решения на основе ограниченной информации, что помогает сократить разрыв между когнитивными процессами человека и искусственным интеллектом. {9-host}
Недостатки:
Few-shot подход (обучение на нескольких примерах) предполагает, что модели предоставляется несколько (обычно от 2 до 10) демонстрационных примеров. systems-analysis.ru Преимущества:
Недостатки:
- Ограниченная обобщающая способность. spotintelligence.com Хотя few-shot модели могут адаптироваться к новым задачам или классам с ограниченными данными, их обобщающая способность может быть ограниченной по сравнению с моделями, обученными на больших наборах размеченных данных. spotintelligence.com
- Чувствительность к составу набора поддержки. spotintelligence.com Выбор примеров поддержки и их inherent biases могут влиять на производительность модели. spotintelligence.com
- Сложность работы с данными вне распределения. spotintelligence.com Few-shot модели могут испытывать трудности при работе с данными, которые значительно отличаются от обучающих данных. spotintelligence.com
- Переобучение на наборе поддержки. spotintelligence.com Поскольку few-shot модели имеют ограниченные данные, они склонны к переобучению на наборе поддержки. spotintelligence.com