Extrahieren Sie Links von der Webseite mit R

Die beiden folgenden Posts sind großartige Beispiele für verschiedene Ansätze zum Extrahieren von Daten von Websites und zum Parsen in R.

Scraping HTML-Tabellen in R-Datenrahmen mit dem XML-Paket

Wie kann ich R (Rcurl / XML-Pakete?!) Zum Scrappen dieser Webseite verwenden?

Ich bin sehr neu in der Programmierung und beginne gerade mit R, daher hoffe ich, dass diese Frage ziemlich grundlegend ist, aber angesichts der obigen Beiträge stelle ich mir das vor.

Ich möchte nur Links extrahieren, die mit einem bestimmten Muster übereinstimmen. Ich habe das Gefühl, dass ich RCurl verwenden könnte, um die Webseiten einzulesen und sie mithilfe von Zeichenfolgenausdrücken nach der Brute-Force-Methode zu extrahieren. Das heißt, wenn die Webseite recht gut gestaltet ist, wie würde ich mit dem XML-Paket vorgehen.

Während ich mehr lerne, "schaue" ich mir gerne die Daten an, während ich das Problem durcharbeite. Das Problem ist, dass einige dieser Ansätze Listen mit Listen usw. generieren, sodass es für jemanden, der neu ist (wie ich), schwierig ist, dahin zu gehen, wo ich hin muss.

Again, ich bin sehr neu in all dem, was programmiert wird, so dass jede Hilfe oder Code-Schnipsel sehr geschätzt werden.

Antworten auf die Frage(4)

Ihre Antwort auf die Frage