Для определения частоты коллокаций в научной литературе можно использовать корпусные технологии. 1 Они позволяют получить информацию о частоте определённого сочетания в языке благодаря большим репрезентативным корпусам текстов. 1
Для анализа коллокаций применяют различные статистические меры: 12
- MI (mutual information). 1 Позволяет сравнить зависимые контекстно-связанные частоты с независимыми. 1
- T-score. 12 Вычисляет частоту совместной встречаемости ключевого слова и его коллокатов. 1
- Log-likelihood. 1 Логарифмическая функция правдоподобия. 1
- LogDice. 1 Нормализованная форма меры Dice, которая основана только на частоте совместной встречаемости и независимых частотах и не учитывает размер корпуса (текста). 1
Для исследования коллокаций используют специальные программы и сервисы, например, «AntConc» и «SketchEngine». 1