Uni-Gramm aus einer Liste von Bi-Gramm entfernen
Ich habe es geschafft, 2 Listen aus Textdokumenten zu erstellen. Das erste ist meine Bi-Gramm-Liste:
keywords = ['nike shoes','nike clothing', 'nike black', 'nike white']
und eine Liste von Stoppwörtern:
stops = ['clothing','black','white']
Ich möchte die Stopps aus meiner Keyword-Liste entfernen. Mit dem obigen Beispiel sollte die Ausgabe, nach der ich suche, folgendermaßen aussehen:
new_keywords = ['nike shoes','nike', 'nike', 'nike'] --> eventually I'd like to remove those dupes.
Das habe ich bisher gemacht:
keywords = open("keywords.txt", "r")
new_keywords = keywords.read().split(",")
stops = open("stops.txt","r")
new_stops = stops.read().split(",")
[i for i in new_keywords if i not in new_stops]
Das Problem, das ich habe, ist, dass es nach den 2 Wörtern sucht, die kombiniert werden, anstatt dass das einzelne Wort stoppt ....