Система рекомендации контента на видеоплатформах устроена следующим образом: алгоритм анализирует большой объём информации о пользователе и сопоставляет её с данными о фильме, сериале, программе, а также с данными о других зрителях, которые посмотрели и оценили этот контент. 2
Для алгоритма рекомендаций важны два типа данных: 2
- Исторические. 2 Дают информацию о просмотрах контента конкретным пользователем или людьми, максимально похожими на пользователя (кто, когда и где посмотрел, сколько времени ушло на просмотр, сколько было повторных просмотров, досматривали ли до конца). 2
- Демографические. 2 Представляют собой социально-демографическую информацию о пользователях: пол, возраст, сферу деятельности и место жительства. 2
Как правило, рекомендации включают три типа фильтрации: 2
- Коллаборативная. 2 На основе действий пользователя его классифицируют по определённой категории. 2 Затем алгоритм идентифицирует действия других людей из той же категории или похожей категории и предлагает контент для просмотра. 2
- На основе содержимого (контентная). 2 Такие механизмы работают в соответствии с описанием элементов и предпочтениями пользователя. 2 В рекомендациях отображаются ключевые понятия, которые потребитель ранее использовал при поиске контента. 2 Например, если он смотрел комедийные шоу, то ему порекомендуют другие программы в этом жанре. 2
- Гибридная. 2 Эта модель объединяет в себе методы двух предыдущих. 2 Самый популярный гибридный подход — двухуровневая модель. 2 Сначала в ней работает коллаборативная фильтрация, которая отбирает небольшое число кандидатов, а затем их ранжирует гораздо более мощная контентная модель. 2
Также при подборе контента алгоритмы смотрят на клики, просмотры трейлеров, начало просмотра фильма/сериала, досмотр, оценки и другие данные. 3 Каждому типу взаимодействия присваивается «вес», который используется при формировании позитивных примеров для обучения. 3