Алгоритм машинного обучения при поиске патентов работает на основе анализа данных и извлечения закономерностей, что позволяет системе применять полученные знания к новым данным. 2
Некоторые этапы работы алгоритма:
- Анализ текстовых описаний патентов. 1 Системы искусственного интеллекта строят векторные представления для каждого текстового описания патента. 1 Эти векторы содержат числовую информацию о смысловой структуре текста и его содержании. 1
- Группировка патентных документов. 1 С помощью алгоритмов кластеризации, таких как k-means, hierarchical clustering, DBSCAN и другие, искусственный интеллект группирует патентные документы на основе схожести их векторных представлений. 1 Патенты, которые имеют близкие векторные представления, считаются семантически схожими и объединяются в один кластер. 1
- Построение модели прогнозирования. 1 Для этого используются собранные признаки и данные. 1 Это может быть модель машинного обучения, такая как логистическая регрессия, случайный лес, нейронные сети и другие. 1 Модель обучается на исторических данных, которые содержат информацию о патентах, выданных или отклоненных офисом по интеллектуальной собственности. 1
- Валидация модели. 1 Модель проверяется на тестовой выборке, которая не использовалась при обучении, для оценки её производительности и способности обобщать знания на новые данные. 1
Таким образом, системы искусственного интеллекта выявляют группы патентов, которые относятся к общей тематике или имеют схожие инновационные решения. 1