Национальный корпус русского языка (НКРЯ) — это собрание текстов в электронной форме, в котором можно осуществлять поиск слов, словосочетаний, грамматических форм, значений слов с помощью определённой поисковой системы. centersot.ru
Некоторые особенности работы НКРЯ:
- Содержание текстов. sites.google.com centersot.ru В корпус включены все типы письменных и устных текстов, представленных в русском языке: художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и другие. sites.google.com centersot.ru
- Лингвистическая разметка. prosv.ru sysblok.ru Все слова в базе имеют такие характеристики, как род, падеж, лицо, залог и так далее. prosv.ru За счёт этого поиск можно проводить по множеству характеристик. prosv.ru
- Разметка текстов. gramota.ru sysblok.ru Обычно она происходит в несколько этапов: сначала в автоматическом режиме, затем эту разметку дополняют и исправляют разметчики-лингвисты, и только потом тексты поступают к программистам. gramota.ru
- Виды корпусов. gramota.ru Для разных пользователей предусмотрены различные корпуса, например, корпус устной речи, корпус социальной сети, параллельный корпус, где собраны параллельные тексты на двух языках. gramota.ru
Некоторые возможности НКРЯ:
- Поиск по контекстам. prosv.ru Можно отыскать конкретные словосочетания и их вариации, контексты. prosv.ru
- Поиск по произведениям классиков. prosv.ru Например, можно собрать все стихи, в которых А. С. Пушкин обращался к школе в том или ином значении. prosv.ru
- Портрет слова. gramota.ru Достаточно ввести слово, чтобы сразу получить о нём много разнообразной информации: с какими словами оно сочетается, как устроен его разбор по составу, какие есть похожие на него слова, в каких видах текстов оно встречается и другие. gramota.ru