Результаты поиска по запросу "sax"

4 ответа

Синтаксический анализ XML - ElementTree против SAX и DOM

У Python есть несколько способов разбора XML ... Я понимаю самые основы анализа сSAX, Он работает как анализатор потока с API, управляемым событиями. Я понимаюDOMпарсер тоже. Он читает XML в память и преобразует его в объекты, к которым можно ...

1 ответ

Не компилируется - обратите внимание, что seqStream нигде не определен, а переименование в поток приводит к ошибке «нет подходящего конструктора» для нового InputSource.

ужно проанализировать непрерывный поток правильно сформированных XML-элементов, для которых мне дают только уже построенныйjava.io.Reader объект. Эти элементы не заключены в корневой элемент и не имеют префикс XML-заголовка<?xml version="1.0"?>", ...

3 ответа

 используйте EntityResolver, который привел бы к «нулевому» DTD - который определил расширение «wiki» как «& wiki;». Кажется, должен быть лучший способ!

у Java-приложение для постобработки XML-файлов. Эти xml-файлы взяты из RDF-экспорта Semantic Mediawiki, поэтому они имеют синтаксис rdf / xml. Моя проблема заключается в следующем: когда я читаю xml-файл, все сущности в файле преобразуются в их ...

ТОП публикаций

5 ответов

Если вам нужно только найти значения конкретных текстовых узлов, тогда XPath. Причина, по которой DOM занимает много памяти, заключается в том, что он читает весь XML и формирует дерево для документа. SAX основан на событиях. Следовательно, исходя из того, что вы описали, XPath лучше всего подходит для вашего сценария.

ужно проанализировать строку xml и найти значения определенных текстовых узлов, значений атрибутов и т. Д. Я делаю это в javascript и для этого использовал класс DOMParser. Позже мне сообщили, что DOM занимает много памяти, а SAX - лучший ...

1 ответ

Да, после долгих поисков и тестов я наконец-то сделал нечто похожее на это: я создал Reader (расширение java.io.BufferedReader), который на лету заменял символы '&' из сущностей XML другим символом, а затем постобработали проанализированный документ, заменив эти символы обратно амперсандами. Это не выглядит чистым, потому что это не так ;-), но это работает.

тоящее время я анализирую документы XHTML с помощью синтаксического анализатора DOM, например: final DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); dbf.setValidating(false); final DocumentBuilder db = ...

3 ответа

 разрешение URL и т. д.

лизирую XML, возвращенный с веб-сайта, но, к сожалению, он немного искажен. Я получаю XML как: <tag attrib="Buy two for &pound;1" />Что, как мне известно, является недействительным, потому что&pound; является символом HTML, а не символом XML ...

1 ответ

Когда мне следует выбирать SAX вместо StAX?

Потоковые xml-парсеры, такие как SAX и StAX, работают быстрее и эффективнее, чем парсеры, создающие древовидную структуру, как DOM-парсеры. SAX - это синтаксический анализатор, то есть это экземпляр шаблона наблюдателя (также называемый шаблоном ...

3 ответа

Хранение определенных значений узлов XML с помощью R's xmlEventParse

У меня большой XML-файл, с которым мне нужно разобратьсяxmlEventParse в R [http://pinard.progiciels-bpi.ca/libR/library/XML/html/xmlEventParse.html], К сожалению, онлайн-примеры являются более сложными, чем мне нужно, и я просто хочу пометить ...

1 ответ

Использование шаблона с OpenXML и SAX

Я создаю большой файл XLSX из таблицы данных, используя метод SAX, предложенный вРазбор и чтение больших файлов Excel с помощью Open XML ...

3 ответа

Синтаксический анализ и кодирование

У меня есть контакт, который испытывает проблемы с SAX при разборе файлов RSS и Atom. По его словам, это выглядит так, как будто текст, исходящий из элементов Item, усекается с апострофом или иногда с ударением. Кажется, проблема с кодировкой ...