FreeLing помогает в развитии речевых технологий, предоставляя инструменты для обработки текста с учётом специфики естественного языка. www.itweek.ru
Некоторые возможности FreeLing:
- Разметка текста (токенизация) — разделение предложения на составляющие: слова, знаки препинания. habr.com www.itweek.ru
- Выделение предложений — разбиение текста на предложения с учётом знаков препинания, использующихся для сокращений. habr.com www.itweek.ru
- Морфологический анализ — определение нормальной формы слова (или форм, если их несколько). habr.com
- Определение составных слов. habr.com
- Вероятностное определение части речи, в том числе — неизвестного слова. habr.com www.itweek.ru
- Обнаружение и определение именной группы — выделение таких объектов, как названия городов, фирм, персоны. habr.com
- Построение дерева зависимостей (слов в предложении). habr.com www.itweek.ru
- Определение местоимений (местоименных словоформ). habr.com www.itweek.ru
- Нормализация и определение дат, чисел, процентных соотношений, валюты и физических величин (скорость, вес, температура, плотность и т. д.). habr.com www.itweek.ru
FreeLing часто используют для таких задач, как извлечение информации, машинный перевод и классификация текста. meta-guide.com