Uni-Gramm aus einer Liste von Bi-Gramm entfernen

Question

Jul 18, 2015, 12:23 PM

Uni-Gramm aus einer Liste von Bi-Gramm entfernen

Ich habe es geschafft, 2 Listen aus Textdokumenten zu erstellen. Das erste ist meine Bi-Gramm-Liste:

keywords = ['nike shoes','nike clothing', 'nike black', 'nike white']

und eine Liste von Stoppwörtern:

stops = ['clothing','black','white']

Ich möchte die Stopps aus meiner Keyword-Liste entfernen. Mit dem obigen Beispiel sollte die Ausgabe, nach der ich suche, folgendermaßen aussehen:

new_keywords = ['nike shoes','nike', 'nike', 'nike'] --> eventually I'd like to remove those dupes.

Das habe ich bisher gemacht:

keywords = open("keywords.txt", "r")
new_keywords = keywords.read().split(",")
stops = open("stops.txt","r")
new_stops = stops.read().split(",")
[i for i in new_keywords if i not in new_stops]

Das Problem, das ich habe, ist, dass es nach den 2 Wörtern sucht, die kombiniert werden, anstatt dass das einzelne Wort stoppt ....

Antworten auf die Frage(4)

Top Fragen

0 die antwort

NoClassDefFoundError: org / hibernate / annotations / common / reflection / MetadataProvider

0 die antwort

Warum behandelt Python "1 ist 1 ** 2" anders als "1000 ist 10 ** 3"?

0 die antwort

Wie soll each_with_object funktionieren?

0 die antwort

Simulieren des Key Press-Ereignisses mit Python für Linux

0 die antwort

Was ist der Unterschied zwischen Personal, Admin, Superuser in Django?

Du bist sehr aktiv! Es ist großartig!

Uni-Gramm aus einer Liste von Bi-Gramm entfernen

Antworten auf die Frage(4)

Ihre Antwort auf die Frage

Top Fragen