Преимущества дистрибутивного анализа:
- позволяет выделить основные единицы языка (фонемы, морфемы, слова, словосочетания), провести их классификацию и установить отношения сочетаемости между ними; 4
- даёт возможность выявить семантическую близость слов и словосочетаний; 4
- помогает разрешить лексическую неоднозначность; 4
- позволяет расширить запросы за счёт ассоциативных связей; 4
- помогает определить тематику документа; 4
- кластеризует документы для информационного поиска; 4
- извлекает знания из текстов; 4
- строит семантические карты различных предметных областей. 4
Недостатки дистрибутивного анализа:
- игнорирует смысловую сторону языка; 1
- даёт вероятностные результаты в отношении выявляемых смысловых связей; 3
- при применении дистрибутивно-семантических моделей в реальных приложениях возникает проблема слишком большой размерности векторов, соответствующей огромному числу контекстов, представленных в текстовом корпусе. 4