Лингвистические корпусы отличаются от обычных текстовых коллекций тем, что они специально отобраны и размечены по различным лингвистическим параметрам для решения определённых задач. 4
Некоторые особенности лингвистических корпусов:
- Репрезентативность. 14 Корпус должен статистически достоверно представлять язык или его часть. 4 Это достигается за счёт необходимого объёма и жанрового многообразия текстов. 4
- Сбалансированность. 4 Параметр определяет, насколько равномерно представлены тексты разных типов. 4
- Электронная форма хранения. 4 Обеспечивает быстрый поиск и извлечение материала. 4
- Разметка (аннотация). 45 Текстам и их компонентам приписываются специальные атрибуты (теги), которые описывают лексические, грамматические и прочие характеристики элементов текста. 34
- Система поиска. 24 Поиск в корпусе обеспечивается с помощью специальных программ — корпусных менеджеров. 5
Лингвистические корпусы могут включать как письменные тексты, так и транскрипты радио- и телепередач. 2