Для поиска фильмов по описанию используются различные алгоритмы машинного обучения, например:
- Модель на базе рекуррентной нейронной сети. github.com С её помощью определяют жанры фильмов по текстовому описанию. github.com
- Метод TF-IDF. nnov.hse.ru Преобразовывает входной текст в матрицу, значениями которой являются слова с некоторым весом. nnov.hse.ru Вес слова пропорционален частоте употребления этого слова в документе и обратно пропорционален частоте употребления слова во всех документах коллекции. nnov.hse.ru
- Word2Vec и Doc2Vec. nnov.hse.ru Преобразуют текст в векторном пространстве посредством преобразования слов в числовые векторы. nnov.hse.ru
Также для рекомендации фильмов по описанию может использоваться алгоритм разложения матрицы (Matrix Factorization), который использует метод «совместная фильтрация». learn.microsoft.com Он основывается на допущении, что если мнение двух людей по какому-либо вопросу совпадает, то и по другому вопросу они будут склонны иметь одинаковое мнение. learn.microsoft.com