в настоящее время поддерживается; недавно был даже новый релиз. И он использует lxml внутренне в зависимости от аргумента конструктора, который вы используете.
ичок в Python, и мне нужна помощь с синтаксисом для поиска и повторения HTML-тегов с использованием lxml. Вот примеры использования, с которыми я имею дело:
HTML-файл довольно хорошо сформирован (но не идеален). Имеет несколько таблиц на экране, одна из которых содержит набор результатов поиска, и по одной для верхнего и нижнего колонтитула. Каждая строка результатов содержит ссылку на детали результатов поиска.
Мне нужно найти среднюю таблицу со строками результатов поиска (эту я смог выяснить):
self.mySearchTables = self.mySearchTree.findall(".//table")
self.myResultRows = self.mySearchTables[1].findall(".//tr")
Мне нужно найти ссылки, содержащиеся в этой таблице (вот где я застреваю):
for searchRow in self.myResultRows:
searchLink = patentRow.findall(".//a")
Кажется, он не находит элементы ссылки.
Мне нужен простой текст ссылки. Я думаю, это было бы что-то вродеsearchLink.text
если я на самом деле получил элементы ссылки в первую очередь.
Наконец, в фактической справке по API для lxml я не смог найти информацию о вызовах find и findall. Я почерпнул их из фрагментов кода, которые нашел в Google. Я что-то упускаю, как эффективно находить и перебирать теги HTML с помощью lxml?