Алгоритм машинного обучения при поиске патентов работает на основе анализа данных и извлечения закономерностей, что позволяет системе применять полученные знания к новым данным. powerpatent.com
Некоторые этапы работы алгоритма:
- Анализ текстовых описаний патентов. damdid2023.hse.ru Системы искусственного интеллекта строят векторные представления для каждого текстового описания патента. damdid2023.hse.ru Эти векторы содержат числовую информацию о смысловой структуре текста и его содержании. damdid2023.hse.ru
- Группировка патентных документов. damdid2023.hse.ru С помощью алгоритмов кластеризации, таких как k-means, hierarchical clustering, DBSCAN и другие, искусственный интеллект группирует патентные документы на основе схожести их векторных представлений. damdid2023.hse.ru Патенты, которые имеют близкие векторные представления, считаются семантически схожими и объединяются в один кластер. damdid2023.hse.ru
- Построение модели прогнозирования. damdid2023.hse.ru Для этого используются собранные признаки и данные. damdid2023.hse.ru Это может быть модель машинного обучения, такая как логистическая регрессия, случайный лес, нейронные сети и другие. damdid2023.hse.ru Модель обучается на исторических данных, которые содержат информацию о патентах, выданных или отклоненных офисом по интеллектуальной собственности. damdid2023.hse.ru
- Валидация модели. damdid2023.hse.ru Модель проверяется на тестовой выборке, которая не использовалась при обучении, для оценки её производительности и способности обобщать знания на новые данные. damdid2023.hse.ru
Таким образом, системы искусственного интеллекта выявляют группы патентов, которые относятся к общей тематике или имеют схожие инновационные решения. damdid2023.hse.ru