Результаты поиска по запросу "lxml"

1 ответ

Cx_freeze с lxml.html TypeError

import lxml.htmlДает мне ошибку, когда я хочу скомпилировать с помощью cx_freeze: Traceback (most recent call last): File "C:\Python27\Scripts\cxfreeze", line 5, in <module> main() File "C:\Python27\lib\site-packages\cx_Freeze\main.py", ...

4 ответа

} Body ')

я есть документ XML, который я пытаюсь проанализировать с помощью Etree.lxml

1 ответ

w3.org/TR/html4/struct/links.html#h-12.3.1

то у lxml есть особенность: make_links_absolute:

ТОП публикаций

0 ответов

@ SMth80 см. Edit2

исал некоторый код на python для анализа заголовка и ссылки с веб-страницы. Первоначально я пытался разобрать ссылки с левой боковой панели, а затем соскрести эти вышеупомянутые документы с каждой страницы, отслеживая каждую ссылку. Я сделал это ...

2 ответа

АНБ полюбит ваше решение!

from lxml import html import requests url = "https://website.com/" page = requests.get(url) tree = html.fromstring(page.content) page.contentОшибка SSLE: [SSL: CERTIFICATE_VERIFY_FAILED] проверка сертификата не удалась (_ssl.c: 748) Я запускаю ...

1 ответ

Python создает XML из CSV в цикле

Я пытаюсь создать XML-файл из CSV CSV: CatOne, CatTwo, CatThree ProdOne, ProdTwo, ProdThree ProductOne, ProductTwo, ProductThreeЖелаемый XML: <root> <prod> <CatOne>ProdOne</CatOne> <CatTwo>ProdTwo</CatTwo> <CatThree>ProdThree</CatThree> ...

2 ответа

Список тегов для удаления. Будут удалены только теги, их содержание будет перенесено в родительский тег.

ема заключается в следующем: у меня есть фрагмент XML, например, так: <fragment>text1 <a>inner1 </a>text2 <b>inner2</b> <c>t</c>ext3</fragment>Для результата хочу удалить все<a>- а также<c>Тэги, но сохраняют свое (текстовое) содержание и ...

2 ответа

, И lxml полностью поддерживает XPath 1.0, а ElementTree поддерживает только подмножество функций XPath.

дело доходит догенерирование XML-данных в Python [https://stackoverflow.com/q/3844360/3357935]Есть две библиотеки, которые я часто рекомендую:LXML [http://lxml.de]а ...

8 ответов

Только вставки кода недостаточно. Вы также должны объяснить, почему это работает :)

лил html через xpath, который затем преобразовал в etree. Что-то похожее на это: <td> text1 <a> link </a> text2 </td>но когда я вызываю element.text, я получаю только text1 (он должен быть там, когда я проверяю свой запрос в FireBug, ...

2 ответа

 необходимо, если на странице много таблиц. Некоторыми возможными критериями будет фильтрация на основе идентификатора таблицы или класса. Например:

аюсь получить ссылки со страницы с xpath. Проблема в том, что мне нужны только ссылки внутри таблицы, но если я применю выражение xpath ко всей странице, я получу ссылки, которые мне не нужны. Например: tree = lxml.html.parse(some_response) ...