в настоящее время поддерживается; недавно был даже новый релиз. И он использует lxml внутренне в зависимости от аргумента конструктора, который вы используете.

ичок в Python, и мне нужна помощь с синтаксисом для поиска и повторения HTML-тегов с использованием lxml. Вот примеры использования, с которыми я имею дело:

HTML-файл довольно хорошо сформирован (но не идеален). Имеет несколько таблиц на экране, одна из которых содержит набор результатов поиска, и по одной для верхнего и нижнего колонтитула. Каждая строка результатов содержит ссылку на детали результатов поиска.

Мне нужно найти среднюю таблицу со строками результатов поиска (эту я смог выяснить):

    self.mySearchTables = self.mySearchTree.findall(".//table")
    self.myResultRows = self.mySearchTables[1].findall(".//tr")

Мне нужно найти ссылки, содержащиеся в этой таблице (вот где я застреваю):

    for searchRow in self.myResultRows:
        searchLink = patentRow.findall(".//a")

Кажется, он не находит элементы ссылки.

Мне нужен простой текст ссылки. Я думаю, это было бы что-то вродеsearchLink.text если я на самом деле получил элементы ссылки в первую очередь.

Наконец, в фактической справке по API для lxml я не смог найти информацию о вызовах find и findall. Я почерпнул их из фрагментов кода, которые нашел в Google. Я что-то упускаю, как эффективно находить и перебирать теги HTML с помощью lxml?

Ответы на вопрос(1)

Ваш ответ на вопрос