Некоторые методы, которые используются для автоматического распознавания склонений в языке:
- Словарные таггеры. 2 Они помогают разбирать слова с чередованиями на стыке основы и окончания, а также слова нерегулярных словоизменительных типов. 2 Однако если анализатор встречает слово, отсутствующее в словаре, качество разбора падает. 2
- Статистические таггеры. 2 Они используют статистику реализации окончаний в базе n-грамм, то есть цепочек из двух, трёх и более идущих подряд словоформ. 2 Статистические таггеры показывают высокое качество частеречной аннотации, в том числе для редких слов. 2
- Строковые метрики. 3 Они помогают распознавать словоформы, которые, как правило, фонетически схожи (отличаются только окончанием, суффиксом или приставкой). 3 К таким метрикам относятся Хэмминга, Левенштейна, триграмм и Джаро–Винклера. 3