Функция Softmax эффективнее Hardmax в задачах классификации, потому что она позволяет делать более «умные» предсказания. 1 Она учитывает вероятности отношения объекта к каждому из классов. 1
Hardmax, в свою очередь, выбирает класс, которому соответствует наибольшее полученное число. 1 Например, если нейронная сеть возвращает числа [10, -5, -10, 9], то Hardmax сообщит, что изображение относится к классу «чихуахуа» с вероятностью 100%, а к каждому из остальных классов — с вероятностью 0%. 1
Кроме того, Softmax позволяет лучше обучать нейронные сети за счёт лучшего пропускания градиентов, нежели в Hardmax. 1 Это связано с тем, что функция Softmax дифференцируема, в то время как в Hardmax производные всегда будут равны нулю. 2