Результаты поиска по запросу "lxml"

2 ответа

 в вашем вопросе.

ел объект с определенным классом: THREAD = TREE.find_class('thread')[0]Теперь я хочу получить все<p> элементы, которые являются его прямыми детьми. Я устал: THREAD.findall("p") THREAD.xpath("//div[@class='thread']/p")Но все это возвращает ...

3 ответа

из scrapy.selector ошибка селектора импорта

Я не могу сделать следующее: from scrapy.selector import SelectorОшибка: Файл "/Desktop/KSL/KSL/spiders/spider.py", строка 1, из scrapy.selector import Selector ImportError: невозможно импортировать имя Selector Как будто LXML не установлен на ...

2 ответа

Просто для справки, вы можете достичь того же результата с

ужно проанализировать XML-файл, чтобы извлечь некоторые данные. Мне нужны только некоторые элементы с определенными атрибутами, вот пример документа: <root> <articles> <article type="news"> <content>some text</content> </article> <article ...

ТОП публикаций

1 ответ

эй, спасибо за ссылки и ответ. Программа, которой я кормлю это, не моя, к сожалению, и является проприетарной. Именно поэтому я хотел знать, возможно ли это. Я понимаю, что протоколы XML и как они хранятся. Но я просто хотел узнать, был ли реализован этот вариант, учитывая тот факт, что об этом спрашивали несколько раз.

ю, что этот вопрос задавался в прошлом, но все они были датированы несколько лет назад. Мне интересно, были ли внесены какие-либо изменения в модули Python, такие как lxml, minidom или etree, которые позволят нам сохранить порядок атрибутов в ...

26 ответов

Я исправил это установкой

оя ошибка: (mysite)zjm1126@zjm1126-G41MT-S2:~/zjm_test/mysite$ pip install lxml Downloading/unpacking lxml Running setup.py egg_info for package lxml Building lxml version 2.3. Building without Cython. ERROR: /bin/sh: xslt-config: not found ** ...

2 ответа

Не уверен, что я полностью следую тому, чего вы пытаетесь достичь, но в конечном итоге я думаю, что вы ищете:

аюсь распечатать / сохранить HTML-код определенного элемента с веб-страницы. Я получил XPath запрошенного элемента из firebug. Все, что я хочу, это сохранить этот элемент в файл. Кажется, мне это не удается. (пробовал XPath с и без/text() в ...

22 ответа

Не удается установить Lxml на Mac OS X 10,9

Я хочу установить Lxml, чтобы потом установить Scrapy. Когда я обновил свой Mac сегодня, он не позволил мне переустановить lxml, я получил следующую ошибку: In file included from ...

7 ответов

Разбор HTML в python - lxml или BeautifulSoup? Какой из них лучше для каких целей?

Из того, что я могу разглядеть, две основные библиотеки парсинга HTML в Python - это lxml и BeautifulSoup. Я выбрал BeautifulSoup для проекта, над которым я работаю, но я выбрал его не по какой-то конкретной причине, кроме как найти синтаксис ...

4 ответа

Кроме того, первая строка устанавливает границы для поиска?

ужно проверить, существует ли определенный тег в файле XML. Например, я хочу посмотреть, существует ли тег в этом фрагменте: <main> <elem1/> <elem2>Hi</elem2> <elem3/> ... </main>В настоящее время я использую некрасивый хак с проверкой ошибок, ...

3 ответа

 и я надеялся, что есть более простой способ, чем этот. Даже с таким коротким примером, как этот, XSLT является многословным и трудным для понимания по сравнению с кодом в моем вопросе о простом удалении элементов.

полностью удалить данный элемент из XML-документа с помощью lxml реализации ElementTree API, но я не вижу простого способа последовательной замены элемента некоторым текстом. Например, с учетом следующего ввода: input = '''<everything> <m>Some ...