Некоторые виды семантической разметки, которые используются в современных лингвистических корпусах:
- Терминологическая разметка. dialogue-conf.org Фиксирует в тексте имена понятий определённой предметной области. dialogue-conf.org Также фиксирует особенности использования общеупотребительной лексики в конкретном подъязыке. dialogue-conf.org
- Разметка отношений. dialogue-conf.org Предполагает выделение фрагментов текста (часто разрывных), которые соответствуют отношениям или ситуациям в определённой предметной области, включая структуру участников. dialogue-conf.org
В Национальном корпусе русского языка (НКРЯ) каждой словоформе приписываются пометы трёх типов: studfile.net
- Разряд (имя собственное, возвратное местоимение и т. д.). studfile.net
- Лексико-семантические характеристики (тематический класс лексемы, признаки каузативности, оценки и т. д.). studfile.net
- Деривационные характеристики («диминутив», «отадъективное наречие» и т. д.). studfile.net
Среди лексико-семантических тэгов выделяют, например: таксономию (тематический класс лексемы) для имён существительных, прилагательных, глаголов и наречий, мереологию (указание на отношения «часть — целое», «элемент — множество») для предметных и непредметных имён и другие. studfile.net