Статистическая обработка матрицы результатов. kpmit.dvfu.ru На первом этапе вычисляются индивидуальные баллы испытуемых, показывающие результат выполнения теста каждым участником. kpmit.dvfu.ru Затем вычисляются средние результаты суммарных баллов испытуемых и по каждому заданию, а также дисперсия и стандартное отклонение суммарных баллов. kpmit.dvfu.ru
Оценка надёжности теста. kpmit.dvfu.ru Она тем выше, чем более согласованы результаты одного и того же человека при повторной проверке знаний посредством того же теста или эквивалентной его формы. kpmit.dvfu.ru Согласованность результатов измеряется коэффициентом корреляции Пирсона. kpmit.dvfu.ru
Определение валидности теста. kpmit.dvfu.ru Этот показатель определяет, насколько хорошо тест делает то, для чего он был создан. kpmit.dvfu.ru Для определения валидности требуется независимый внешний критерий, то есть оценка эксперта (преподавателя). kpmit.dvfu.ru За коэффициент валидности принимают коэффициент корреляции результатов тестовых измерений и критерия. kpmit.dvfu.ru
Экспертные методы. cyberleninka.ru Позволяют оценить, в какой степени задания измеряют именно те знания, умения и навыки, для которых разрабатывается тест, а также оценить задания с точки зрения их формы. cyberleninka.ru В основе экспертных методов лежит соотнесение содержания и форм заданий с требованиями, изложенными в спецификации. cyberleninka.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.