Отсутствие поддержки вычисления оценок внимания с заполняющими токенами. huggingface.co Это приводит к значительному замедлению при пакетном выводе с заполняющими токенами. huggingface.co
Потеря гибкости. pytorch.org Для реализации новых вариантов внимания часто нужно писать собственное ядро. pytorch.org
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.