Для создания тезаурусов в современных информационных системах используются различные методы, например:
- Лингвистический анализ. 2 Включает лексический анализ (разбор текста на отдельные абзацы, предложения, слова), морфологический анализ (автоматическое распознавание частей речи каждого слова текста), синтаксический анализ (автоматическое выделение семантических элементов предложения) и семантический анализ (определение информативности текстовой информации и выделение информационно-логической основы текста). 2
- Статистический анализ. 2 Ориентирован на извлечение смысла текста по частотному распределению слов в нём. 2
- Использование специального программного обеспечения. 1 Для формирования русскоязычных тезаурусов активно разрабатывается и внедряется специальное программное обеспечение. 1
- Анализ совместной встречаемости слов. 1 На основе этого метода тезаурусы могут быть построены автоматически. 1