Работа мобильных новостных агрегаторов устроена следующим образом: 1
- Сбор текста, дат и заголовков в первичный документ. 1 Это происходит через RSS-каналы, которые собирают информацию с новостных сайтов. 3 Также агрегаторы используют веб-скрейпинги — автоматизированную технологию сбора текстов на основе RSS-каналов. 3
- Обработка текстовой информации с помощью моделей машинного обучения. 1 На выходе получается нормализованная форма текста, в которой можно выделить теги, именные сущности (персоны, объекты, события), географию, а также вероятную категорию (тему). 1
- Агрегирование обработанных статей в события. 1 На этом этапе все статьи ранжируются по значимости. 1
- Индексация событий и их показ конечному пользователю в зависимости от настроек ленты. 1
Пользователь может настроить приложение таким образом, чтобы ему показывались только новости определённых категорий. 2