Некоторые особенности лингвистического анализа при идентификации автора:
- Исследование текста на разных уровнях. 2 Текст анализируют на пунктуационном, орфографическом, синтаксическом, лексико-фразеологическом и стилистическом уровнях. 2
- Учёт индивидуальных языковых предпочтений. 5 При идентификации автора создают портрет «языковой личности», в котором отражаются различные характеристики личности: гендерные, возрастные, психологические, социальные и другие. 5
- Использование статистических характеристик. 3 В качестве параметров текста выбирают, например, количество использования определённых частей речи, знаков препинания, фразеологизмов, архаизмов, редких и иностранных слов, объём словаря и другие. 3
- Сравнение двух текстов. 3 Сравнивают текст с заведомо известным автором (эталонный текст) и текст, авторство которого требуется установить, подтвердить или опровергнуть (спорный текст). 3
- Использование формальных параметров. 3 Такие параметры должны обладать массовостью, устойчивостью и различающей способностью. 3
Для идентификации автора также применяют подходы из теории распознавания образов, математической статистики и теории вероятностей, алгоритмы нейронных сетей и кластерного анализа. 23