Mit welchen Algorithmen kann ich Inhalte auf einer Webseite identifizieren?

Ich habe eine Webseite im Browser geladen (dh das DOM und die Elementpositionierung sind für mich beide zugänglich) und ich möchte das Blockelement (oder eine sortierte Liste dieser Elemente) finden, das wahrscheinlich den meisten Inhalt enthält (wie in ein fortlaufender Textblock). Das Ziel ist es, Dinge wie Menüs, Kopf- und Fußzeilen und dergleichen auszuschließen.

Antworten auf die Frage(4)

Ihre Antwort auf die Frage