extrahieren Sie mehrere HTML-Tabellen mit hxt
Mein Problem ist, ich muss alle Tabellen aus einem HTML-Dokument extrahieren und sie in eine Liste von Tabellen setzen.
Daher verstehe ich, dass der Endfunktionstyp sein sollte
getTable :: a [XmlTree] [[String]]
Zum Beispiel mit der folgenden XML:
<table class="t1">
<tr>
<td>x</td>
<td>y</td>
</tr>
<tr>
<td>a</td>
<td>b</td>
</tr>
</table>
<table class="t2">
<tr>
<td>3</td>
<td>5</td>
</tr>
<tr>
<td>toto</td>
<td>titi</td>
</tr>
</table>
Ich weiß, wie ich alle Zeilen aus einem xmlTree (Beispiel1) oder allen Tags "tables" abrufen kann, die mir den Typ [XmlTree] geben, aber ich weiß nicht, wie ich den Pfeil Beispiel1 innerhalb des Ergebnisses von Test2 zuordnen kann.
Ich bin sicher, es ist offensichtlich, aber ich kann es nicht finden.
test2 :: IO [[XmlTree]]
test2 = runX $ parseXML "table.xml" >>> is "table">>> listA getChildren
example1 :: ArrowXml a => a XmlTree [String]
example1 = is "table" /> listA (getChildren >>> is "td" /> getText)