Решение Джеффа в порядке, если у вас нет таблиц, потому что текст, расположенный в таблице, торчит, как cell1cell2cell3. Чтобы предотвратить эту проблему, используйте этот код (пример C #):
небольшая помощь с пакетом HTML Agility!
В основном я хочу захватитьпростой текст в рамках узла тела HTML. До сих пор я пробовал это в vb.net, и он не возвращает внутренний текст, означающий, что никаких изменений не видно, по крайней мере, из того, что я вижу.
Dim htmldoc As HtmlDocument = New HtmlDocument
htmldoc.LoadHtml(html)
Dim paragraph As HtmlNodeCollection = htmldoc.DocumentNode.SelectNodes("//body")
If Not htmldoc Is Nothing Then
For Each node In paragraph
node.ParentNode.RemoveChild(node, True)
Next
End If
Return htmldoc.DocumentNode.WriteContentTo
Я попробовал это:
Return htmldoc.DocumentNode.InnerText
Но все равно не повезло!
Любой совет???