Результаты поиска по запросу "iterparse"
Итеративный разбор HTML (с lxml?)
В настоящее время я пытаюсь итеративно анализировать очень большой HTML-документ (я знаю ... хм), чтобы уменьшить объем используемой памяти. Проблема в том, что я получаю ошибки синтаксиса XML, такие как: lxml.etree.XMLSyntaxError: Attribute ...
Почему lxml.etree.iterparse () пожирает всю мою память?
Это в конечном итоге потребляет всю мою доступную память, а затем процесс останавливается. Я пытался изменить тег с
использование lxml и iterparse () для анализа большого (+ - 1Gb) XML-файла
Я должен проанализировать XML-файл объемом 1 ГБ со структурой, подобной приведенной ниже, и извлечь текст в тегах «Автор» и «Содержимое»: <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum dolor sit ...
Разбор огромных, плохо закодированных файлов XML в Python
Я работал над кодом, который анализирует внешние XML-файлы. Некоторые из этих файлов огромны, до гигабайт данных. Нет необходимости говорить, что эти файлы н...