parsing eine URL in Python mit wechselnden Teil drin
Ich analysiere eine URL in Python. Unten finden Sie eine Beispiel-URL und den Code. Ich möchte die (74743) von der URL trennen und eine for-Schleife erstellen, die sie aus einer Teileliste entnimmt. Versucht, urlparse zu verwenden, konnte es jedoch hauptsächlich aufgrund der sich ändernden Teile in der URL nicht bis zum Ende vervollständigen. Ich möchte nur den einfachsten und schnellsten Weg, dies zu tun.
Beispiel-URL:
http://example.com/wps/portal/lYuxDoIwGAYf6f9aqKSjMNQ/?PartNo=74743&IntNumberOf=&is=
(http: //example.com/wps/porta) Immer fest
(lYuxDoIwGAYf6f9aqKSjMNQ) Immer ändern
(74743) Wird von einem Listennamen übernommen. Parts
(IntNumberOf = & is =) Ändert sich auch je nach Abschnitt der Website
Hier ist der Code:
from lxml import html
import requests
import urlparse
Parts = [74743, 85731, 93021]
url = 'http://example.com/wps/portal/lYuxDoIwGAYf6f9aqKSjMNQ/?PartNo=74743&IntNumberOf=&is='
parsing = urlparse.urlsplit(url)
print parsing