extrahieren Sie mehrere HTML-Tabellen mit hxt

Mein Problem ist, ich muss alle Tabellen aus einem HTML-Dokument extrahieren und sie in eine Liste von Tabellen setzen.

Daher verstehe ich, dass der Endfunktionstyp sein sollte

getTable :: a [XmlTree] [[String]]

Zum Beispiel mit der folgenden XML:

<table class="t1">
<tr>
    <td>x</td>
    <td>y</td>
</tr>
<tr>
    <td>a</td>
    <td>b</td>
</tr>
</table>
<table class="t2">
<tr>
    <td>3</td>
    <td>5</td>
</tr>
<tr>
    <td>toto</td>
    <td>titi</td>
</tr>
</table>

Ich weiß, wie ich alle Zeilen aus einem xmlTree (Beispiel1) oder allen Tags "tables" abrufen kann, die mir den Typ [XmlTree] geben, aber ich weiß nicht, wie ich den Pfeil Beispiel1 innerhalb des Ergebnisses von Test2 zuordnen kann.

Ich bin sicher, es ist offensichtlich, aber ich kann es nicht finden.

test2 ::  IO [[XmlTree]]
test2 = runX $ parseXML "table.xml" >>> is "table">>> listA getChildren

example1 ::  ArrowXml a => a XmlTree [String]
example1  = is "table" /> listA (getChildren >>> is "td"  /> getText)

Antworten auf die Frage(1)

Ihre Antwort auf die Frage