R regulärer Ausdruck: http-Matching
Ich habe Probleme, reguläre Ausdrücke zu verwenden, um mit http-Links übereinzustimmen. Ich habe ein Muster, das ich aus dem Quellcode einer Website extrahieren möchte. Der Quellcode enthält mehr als 200 Zeilen mit viel HTML-Kauderwelsch</html><body... useless links useless images'
Die http-Links, die ich brauche, fallen unter dieses Muster:
<a href"http:www.google.com/....1,1">
<a href"http:www.google.com/....2,2">
<a href"http:www.google.com/....3,3">
Ich möchte nur die http-Links erhalten, und das eindeutige Muster für sie ist das Ende. Bitte helfen Sie, ich habe stundenlang mit gusb, regxpr und grep experimentiert.