Результаты поиска по запросу "lxml"

4 ответа

Как мне иметь дело с XMLSyntaxError в Python lxml при анализе большого файла XML?

Я пытаюсь проанализировать файл XML размером более 2 ГБ с библиотекой Python lxml. К сожалению, в XML-файле нет строки, указывающей кодировку символов, поэтому я должен установить ее вручную. Хотя при переборе файла все же появляются странные ...

2 ответа

Как разобрать искаженный HTML в Python

Мне нужно просмотреть дерево DOM разобранного документа HTML. Я использую uTidyLib перед анализом строки с помощью lxml a = tidy.parseString (html_code, options) dom = etree.fromstring (str (a)) иногда я получаю сообщение об ошибке, кажется, ...

1 ответ

Ошибка lxml «IOError: Ошибка чтения файла» при синтаксическом анализе мобильного телефона facebook в скрипте python scraper

Я использую модифицированный скрипт изВход в Facebook с Python [https://stackoverflow.com/questions/2030652/logging-into-facebook-with-python] Почта : #!/usr/bin/python2 -u # -*- coding: utf8 -*- facebook_email = "[email protected]" ...

ТОП публикаций

2 ответа

импорт lxml завершается неудачно в OSX после (казалось бы) успешной установки

Я пытаюсь установить lxml для python на OS X 10.6.8 Я побежалsudo env ARCHFLAGS="-arch i386 -arch x86_64" easy_install lxml в терминале на основе этого ответа на вопрос установки ...

2 ответа

Beautifulsoup не распознает lxml

Я пытаюсь использоватьlxml как синтаксический анализатор для BeautifulSoup, потому что по умолчанию он НАМНОГО медленнее, однако я получаю эту ошибку: soup = BeautifulSoup(html, "lxml") ...

4 ответа

Как выбрать родителя на основе ребенка в lxml?

У меня есть этот код: <table cellspacing="1" cellpadding="1" border="0"> <tbody> <tr> <td>Something else</td> </tr> <tr> <td valign="top"> <a href="http://exact url">Something</a> </td> <td valign="top">Something else</td> </tr> </tbody> ...

3 ответа

использование lxml и iterparse () для анализа большого (+ - 1Gb) XML-файла

Я должен проанализировать XML-файл объемом 1 ГБ со структурой, подобной приведенной ниже, и извлечь текст в тегах «Автор» и «Содержимое»: <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum dolor sit ...

2 ответа

парсинг таблицы HTML с использованием python - HTMLparser или lxml

У меня есть HTML-страница, которая состоит из таблицы, и я хочу получить все значения в td, tr в этой таблице. Я пытался работать с Beautifulsoup, но теперь я хотел работать с парсером lxml или HML с python. Я приложил пример. Я хочу получить ...

3 ответа

получить ошибки при импорте lxml.etree в python

я установил lxml на мой Mac, когда я печатаю на Python, как это localhost:lxml-3.0.1 apple$ python Python 2.7.3 (v2.7.3:70274d53c1dd, Apr 9 2012, 20:52:43) [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin Type "help", "copyright", "credits" ...

1 ответ

Разбор CDATA в xml с python

Мне нужно проанализировать файл XML с несколькими блоками CDATA, которые мне нужно сохранить для последующего построения: <process id="process1"> <log name="name1" device="device1"><![CDATA[timestamp value]]]></log> <log name="name2" ...