Результаты поиска по запросу "lxml"
Как мне иметь дело с XMLSyntaxError в Python lxml при анализе большого файла XML?
Я пытаюсь проанализировать файл XML размером более 2 ГБ с библиотекой Python lxml. К сожалению, в XML-файле нет строки, указывающей кодировку символов, поэтому я должен установить ее вручную. Хотя при переборе файла все же появляются странные ...
Как разобрать искаженный HTML в Python
Мне нужно просмотреть дерево DOM разобранного документа HTML. Я использую uTidyLib перед анализом строки с помощью lxml a = tidy.parseString (html_code, options) dom = etree.fromstring (str (a)) иногда я получаю сообщение об ошибке, кажется, ...
Ошибка lxml «IOError: Ошибка чтения файла» при синтаксическом анализе мобильного телефона facebook в скрипте python scraper
Я использую модифицированный скрипт изВход в Facebook с Python [https://stackoverflow.com/questions/2030652/logging-into-facebook-with-python] Почта : #!/usr/bin/python2 -u # -*- coding: utf8 -*- facebook_email = "[email protected]" ...
импорт lxml завершается неудачно в OSX после (казалось бы) успешной установки
Я пытаюсь установить lxml для python на OS X 10.6.8 Я побежалsudo env ARCHFLAGS="-arch i386 -arch x86_64" easy_install lxml в терминале на основе этого ответа на вопрос установки ...
Beautifulsoup не распознает lxml
Я пытаюсь использоватьlxml как синтаксический анализатор для BeautifulSoup, потому что по умолчанию он НАМНОГО медленнее, однако я получаю эту ошибку: soup = BeautifulSoup(html, "lxml") ...
Как выбрать родителя на основе ребенка в lxml?
У меня есть этот код: <table cellspacing="1" cellpadding="1" border="0"> <tbody> <tr> <td>Something else</td> </tr> <tr> <td valign="top"> <a href="http://exact url">Something</a> </td> <td valign="top">Something else</td> </tr> </tbody> ...
использование lxml и iterparse () для анализа большого (+ - 1Gb) XML-файла
Я должен проанализировать XML-файл объемом 1 ГБ со структурой, подобной приведенной ниже, и извлечь текст в тегах «Автор» и «Содержимое»: <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum dolor sit ...
парсинг таблицы HTML с использованием python - HTMLparser или lxml
У меня есть HTML-страница, которая состоит из таблицы, и я хочу получить все значения в td, tr в этой таблице. Я пытался работать с Beautifulsoup, но теперь я хотел работать с парсером lxml или HML с python. Я приложил пример. Я хочу получить ...
получить ошибки при импорте lxml.etree в python
я установил lxml на мой Mac, когда я печатаю на Python, как это localhost:lxml-3.0.1 apple$ python Python 2.7.3 (v2.7.3:70274d53c1dd, Apr 9 2012, 20:52:43) [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin Type "help", "copyright", "credits" ...
Разбор CDATA в xml с python
Мне нужно проанализировать файл XML с несколькими блоками CDATA, которые мне нужно сохранить для последующего построения: <process id="process1"> <log name="name1" device="device1"><![CDATA[timestamp value]]]></log> <log name="name2" ...