Вопросы к Поиску с Алисой
При работе с текстовыми документами используется метод Text Mining — подход к извлечению знаний из больших коллекций документов, основанный на статистических методах. www.cnews.ru
Он позволяет, например, автоматически группировать похожие тексты или выявлять наиболее важные темы в огромных коллекциях документов. www.cnews.ru При этом Text Mining работает не с «сырым» текстом, а с его числовым представлением, что позволяет напрямую интегрировать результаты анализа в процессы предиктивного моделирования. www.cnews.ru
Для этого все документы разбиваются на отдельные термины. www.cnews.ru Каждый из них представляется в виде числового вектора, отдельным элементом которого является количество вхождений конкретного термина в данный документ. www.cnews.ru
Также при анализе текстовых документов могут использоваться и другие методы, например: