Существуют два основных подхода к анализу структуры текста в информационном поиске: 1
Графематический анализ предназначен для выделения элементов структуры текста: параграфов, абзацев, предложений, отдельных слов и т. д.. 1Цель морфологического анализа — определение морфологических характеристик слова и его основной словоформы. 1Задача синтаксического анализа — определение синтаксической зависимости слов в предложении. 1Семантический анализ делает акцент на смысловом понимании текста. 1
Также существует подход, при котором исходные данные представлены в виде онтологий, а поиск ведётся путём указания свойств искомого объекта. 4