Вопросы к Поиску с Алисой
Корпус языка строится на основе принципа репрезентативности. xn--j1ahfl.xn--p1ai {7-host} Под ним понимается способность корпуса отражать все свойства проблемной области, релевантные для данного типа лингвистических исследований. xn--j1ahfl.xn--p1ai Тексты в корпус выбираются не случайно, а в соответствии с областью реализаций интересующих исследователя языковых явлений. xn--j1ahfl.xn--p1ai
Ещё один принцип — полнота корпуса. xn--j1ahfl.xn--p1ai Задача создателей корпуса заключается в сборе большего количества текстов, относящихся к тому подмножеству языка, для изучения которого корпус создаётся. xn--j1ahfl.xn--p1ai
Для решения различных лингвистических задач необходимо, чтобы тексты и отдельные языковые единицы внутри текстов содержали дополнительную лингвистическую и металингвистическую информацию — разметку (аннотацию). xn--j1ahfl.xn--p1ai В современных корпусах помимо метаразметки (отражающей различную экстралингвистическую информацию о тексте, включая его название, автора, жанровую принадлежность и т.п.) содержится разметка, соответствующая различным уровням лингвистического описания — морфологическая, синтаксическая, фонетическая и др.. xn--j1ahfl.xn--p1ai
Разница в отечественном и зарубежном подходе к построению корпусов языка заключается в том, что взгляды отечественных учёных и их зарубежных коллег относительно практики конструирования лингвистических корпусов схожи. nauchkor.ru По своему наполнению корпусы русского и других языков (например, европейских) устроены идентично: в них присутствует информация обо всех гранях языка, например, стилистическая многожанровость, случаи употребления особых коллокаций и фразеологизмов, указаны примеры полисемии и омонимии. nauchkor.ru