Wie klassifiziere ich URLs? Was sind URL-Funktionen? Auswählen und Extrahieren von Features aus URL

Ich arbeite gerade an einem Klassifizierungsproblem. Das My Trained-Modell (Maschinelles Lernen) ist ein Zwei-Klassen-Problem und muss entscheiden / vorhersagen, ob eine URL zugelassen oder blockiert werden soll.

Meine Frage ist sehr spezifisch.

Wie klassifiziere ich URLs? Soll ich normale Textanalysemethoden verwenden?Was sind URLs?Wie wähle ich Features aus einer URL aus und extrahiere sie?

Antworten auf die Frage(1)

Ihre Antwort auf die Frage