¿Deseas rodar tu propio analizador XML / algoritmo de análisis XML?

Entonces, como un proyecto divertido, decidí escribir mi propio analizador XML. No, no para analizar un documento específico, y no, no usar una biblioteca de analizador XML. Me refiero a escribir código para analizar cualquier documento XML en una estructura de datos utilizable. Solo porque me gusta el reto. :-)

Dicho esto, hasta ahora se ha demostrado que es ... interesante. No es tan fácil de analizar (especialmente cuando empiezas a tener en cuenta los caracteres especiales, CDATA, etiquetas vacías, comentarios, etc.) como se veía inicialmente.

¿Hay algún algoritmo de análisis de XML bien documentado o explicaciones en algún lugar que alguien conozca? Parece que hay implementaciones bien documentadas de Queue and Stack y BTree y etc., etc., etc., pero no estoy seguro de haber visto un algoritmo de analizador XML simple y bien documentado ...

Repito: yo soyno Buscando una biblioteca de analizador pre-construida! Estoy buscando información sobrecómo crear mi propia biblioteca de analizador pre-construida! No me digas "usa expat" o "usa SAX" o lo que sea. Eso no es lo que estoy pidiendo.

Respuestas a la pregunta(3)

Su respuesta a la pregunta