Вычисление градиента для многоклассовой классификации отличается от бинарной тем, что для многоклассовой классификации бинарная кросс-энтропия заменяется на обычную. 1
Также для многоклассовой классификации можно использовать методы «один-против-одного», «один-против-всех» и коды, исправляющие ошибки, которые решают многоклассовую классификацию с помощью набора бинарных классификаторов. 2 Альтернативно можно решать многоклассовую классификацию напрямую. 2 В этом случае прогноз будет представлять собой вектор из рейтингов для каждого из классов, а в качестве прогноза будет назначаться класс, обладающий максимальным рейтингом. 2
Ещё для многоклассовой классификации в scikit-learn используется подход «один против всех» и алгоритм усечённого градиента. 3