Алгоритм подбора электронных книг в книжных сервисах работает на основе анализа предпочтений пользователей и истории их взаимодействия с произведениями. books.yandex.ru rugpt.io
Некоторые этапы работы алгоритма:
- Подготовка данных. github.com Из набора данных удаляют повторы, группируют книги по количеству оценок, отбирают те, у которых их больше определённого количества. github.com Также группируют пользователей по количеству оценок и отбирают тех, у кого их больше определённого числа. github.com
- Создание сводной таблицы. github.com Её преобразуют в разреженную матрицу. github.com
- Создание модели. github.com В качестве данных обучения используют разреженную матрицу оценок пользователей и книг. github.com
- Поиск выбранной книги. github.com С помощью созданной модели находят соседние книги. github.com
- Сортировка. github.com Произведения сортируют по расстоянию до соседних книг по убыванию. github.com
- Отбор списка книг. github.com По полученным индексам отбирают рекомендованные книги пользователю. github.com
Некоторые параметры, которые учитываются при подборе книг:
- жанр, автор и тематика произведения; rugpt.io blog.rt.ru
- отзывы, рейтинги и стилистические особенности книг; rugpt.io
- предпочтения пользователя по объёму книги; rugpt.io
- настроение пользователя, которое можно указать при запросе рекомендаций. rugpt.io
Например, в «Яндекс Книгах» алгоритм адаптируется к поведению пользователей, анализируя историю чтения, просмотры контента, добавление книг в коллекцию и другие метрики. books.yandex.ru