Некоторые ключевые аспекты, которые учитываются при категоризации и анализе настроений в текстах:
- Эмоциональное содержание текста. 1 В простейших случаях тексты классифицируют на позитивные и негативные, в некоторых случаях добавляется класс нейтральных текстов. 1 Более сложные подходы определяют эмоциональные состояния, связанные с текстом, например, страх, гнев, грусть или радость. 1
- Контекст. 13 Классификация может варьироваться в зависимости от субъективности или объективности предыдущих и следующих предложений. 3
- Использование тональных словарей. 1 В их основе лежит анализ эмоциональной окраски текста: каждому слову или фразе присваивается определённый числовой вес или оценка, которые отображают степень его эмоциональной окраски (положительной или отрицательной). 1
- Наличие в тексте прилагательных, глаголов или фраз, подчёркивающих состояние и чувства героев. 2 Например, слово «соскучившийся» подчеркнёт тоску героя и стремление быть ближе, а «рассердился» — тёмные краски и обоснует соответствующие действия и поступки. 2
Также при анализе настроений учитывается предобработка текста: удаление неуместной информации, токенизация (разделение на отдельные слова или токены), удаление стоп-слов и приведение слов к их корневой форме. 5