Вопросы к Поиску с Алисой
Система семантической разметки в Национальном корпусе русского языка (НКРЯ) работает на основе автоматической разметки текстов с помощью программы Semmarkup в соответствии с семантическим словарем корпуса. ruscorpora.ru
При такой разметке большинству слов в тексте приписывается один или несколько семантических и словообразовательных признаков. ruscorpora.ru Например, для предметных имён это могут быть лица, животные, растения, вещества и материалы, для прилагательных — размер, форма, цвет, вкус, запах, место, время, свойство человека и другие, для глаголов — движение, эмоция, речь, поведение человека и другие. ruslang.ru
Используется фасетная классификация, при которой одно слово может попадать в несколько классов. ruscorpora.ru
Для решения проблемы неоднозначности (когда программа автоматически расставляет пометы в тексте, она каждому вхождению слова приписывает все пометы, которые есть в словаре, потому что программа не знает, в каком значении выступает слово в данном тексте) используются семантические фильтры. rakhilina.ru Они позволяют оставлять при каждом вхождении слова только одну помету. rakhilina.ru
Фильтр работает следующим образом: rakhilina.ru