Entfernen von Elementen zwischen XML-Tags und deren Inhalten

Ich müsste alles zwischen XML-Tags entfernen, insbesondere Leerzeichen und Zeilenumbrüche.

Zum Beispiel das Entfernen von Leerzeichen und Nachrichten von:
</ node> \ n <node id = "whatever">

bekommen:
</ node> <node id = "whatever">

Dies ist nicht zum manuellen Parsen von XML gedacht, sondern um XML-Daten vorzubereiten, bevor sie von einem Tool analysiert werden. Um genauer zu sein, ich verwende Hpricot (Ruby) zum Parsen von XML und leider stecken wir derzeit in Version 0.6.164 fest, also ... Ich kenne keine neueren Versionen, aber diese gibt oft seltsame Knoten zurück (Objekte), die nur Leerzeichen und Zeilenumbrüche enthalten. Die Idee ist also, das XML zu bereinigen, bevor es in ein Hpricot-Dokument konvertiert wird. Alternative Lösungen werden geschätzt.

Ein Beispiel aus einem Test: NoMethodError: undefinierte Methode `children 'für" \ n ": Hpricot :: Text
Der interessante Teil hier ist nicht der NoMethodError, denn das ist in Ordnung, aber das Hpricot :: Text-Element enthält nur eine neue Zeile und nichts mehr.

Antworten auf die Frage(5)

Ihre Antwort auf die Frage