Результаты поиска по запросу "iterparse"

4 ответа

Итеративный разбор HTML (с lxml?)

В настоящее время я пытаюсь итеративно анализировать очень большой HTML-документ (я знаю ... хм), чтобы уменьшить объем используемой памяти. Проблема в том, что я получаю ошибки синтаксиса XML, такие как: lxml.etree.XMLSyntaxError: Attribute ...

3 ответа

Почему lxml.etree.iterparse () пожирает всю мою память?

Это в конечном итоге потребляет всю мою доступную память, а затем процесс останавливается. Я пытался изменить тег с

2 ответа

Почему elementtree.ElementTree.iterparse использует так много памяти?

ТОП публикаций

3 ответа

использование lxml и iterparse () для анализа большого (+ - 1Gb) XML-файла

Я должен проанализировать XML-файл объемом 1 ГБ со структурой, подобной приведенной ниже, и извлечь текст в тегах «Автор» и «Содержимое»: <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum dolor sit ...

4 ответа

Разбор огромных, плохо закодированных файлов XML в Python

Я работал над кодом, который анализирует внешние XML-файлы. Некоторые из этих файлов огромны, до гигабайт данных. Нет необходимости говорить, что эти файлы н...