Некоторые методы, которые используются в лингвистике для выявления основы слова:
- Стемминг. 3 Это процесс нахождения основы слова для заданного исходного слова. 3 Основа слова не обязательно совпадает с морфологическим корнем слова. 3
- Аффикс-стеммеры. 3 Подходы, которые обрабатывают суффиксы или окончания, а иногда и префиксы. 3 Например, для английского слова indefinitely такой метод определит, что конструкция «in», стоящая в начале слова, является префиксом и может быть удалена для получения основы слова. 3
- Лемматизация. 3 Сложный подход к определению основы слова, который требует знания, как создаются различные формы слова. 3
- Стеммер Портера. 3 Алгоритм, который происходит без использования каких-либо баз основ: только множество существующих суффиксов и вручную заданные правила. 3 На каждом шаге отсекается словообразующий суффикс, а оставшаяся часть проверяется на соответствие правилам (например, для русских слов основа должна содержать не менее одной гласной). 3
Для получения наиболее полной картины изучаемого явления обычно исследователь комбинирует несколько подходов. 2