Для использования фрагментов текста в аналитических исследованиях применяют различные методы, например:
- Контент-анализ. 1 Позволяет выявить, что существовало до текста и что получило в нём отражение, определить характеристики формы текста (язык, структуру и жанр сообщения, ритм и тон речи) и оценить эффекты воздействия текста. 1 В качестве единицы анализа могут выступать слово, высказывание, заголовок, абзац, персонаж и т. д.. 1
- Интеллектуальный анализ текста. 2 Помогает идентифицировать факты, тенденции, закономерности, концепции, ключевые слова и другие ценные элементы в текстовых данных. 2 Для обработки текста используют обработку естественного языка (NLP), синтаксический анализ, извлечение текста и другие методы. 2
- Фактографический анализ. 3 Позволяет искать в текстовых информационных массивах информацию о требуемом объекте, выделять из большого объёма полученной информации наиболее значимые факторы, идентифицирующие объект. 3
Также для работы с текстовыми данными используют токенизацию — разделение текста на единицы, которые будут анализироваться в ходе текстового анализа. 4 Это могут быть слова, слоги, словосочетания, предложения или отдельные буквы. 4