Для извлечения текста из HTML-элементов с помощью XPath можно использовать функцию text(). 4
Общий пример выражения для выбора текстовых узлов с помощью XPath: //tagname/text(). 4 Оно выбирает все текстовые узлы, которые являются прямыми дочерними элементами указанного имени тега. 4
Например, чтобы выбрать весь текст внутри элементов абзаца, можно использовать выражение //p/text(). 4 Если нужно извлечь текст из конкретного элемента с идентификатором (ID) или классом, можно использовать выражения //*[@id='specific-id']/text() или //tagname[@class='specific-class']/text(). 4
Чтобы определить соответствующий путь XPath данных для парсинга, можно открыть веб-страницу в браузере Google Chrome и «просмотреть код» элемента HTML, который нужно спарсить (ПКМ по нужному элементу > Просмотреть код). 1 Затем в панели разработчика с выделенным элементом щёлкнуть правой кнопкой мыши и скопировать соответствующий путь селектора XPath. 1