Некоторые ключевые аспекты, которые учитываются при категоризации и анализе настроений в текстах:
- Эмоциональное содержание текста. na-journal.ru В простейших случаях тексты классифицируют на позитивные и негативные, в некоторых случаях добавляется класс нейтральных текстов. na-journal.ru Более сложные подходы определяют эмоциональные состояния, связанные с текстом, например, страх, гнев, грусть или радость. na-journal.ru
- Контекст. na-journal.ru en.wikipedia.org Классификация может варьироваться в зависимости от субъективности или объективности предыдущих и следующих предложений. en.wikipedia.org
- Использование тональных словарей. na-journal.ru В их основе лежит анализ эмоциональной окраски текста: каждому слову или фразе присваивается определённый числовой вес или оценка, которые отображают степень его эмоциональной окраски (положительной или отрицательной). na-journal.ru
- Наличие в тексте прилагательных, глаголов или фраз, подчёркивающих состояние и чувства героев. disshelp.ru Например, слово «соскучившийся» подчеркнёт тоску героя и стремление быть ближе, а «рассердился» — тёмные краски и обоснует соответствующие действия и поступки. disshelp.ru
Также при анализе настроений учитывается предобработка текста: удаление неуместной информации, токенизация (разделение на отдельные слова или токены), удаление стоп-слов и приведение слов к их корневой форме. habr.com