Wie drucke ich mit Python NLTK nur das Wort selbst in einem WordNet-Synset aus?
Gibt es einen Weg in Python 2.7 mitNLTK
um nur das Wort zu verstehen und nicht die zusätzliche Formatierung, die dies beinhaltet"synset"
und die Klammern und die"n.01"
usw?
Zum Beispiel, wenn ich es tue
wn.synsets('dog')
Meine Ergebnisse sehen so aus:
[Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'), Synset('frank.n.02'), Synset('pawl.n.01'), Synset('andiron.n.01'), Synset('chase.v.01')]
Wie kann ich stattdessen eine solche Liste bekommen?
dog
frump
cad
frank
pawl
andiron
chase
Gibt es eine Möglichkeit, dies mitNLTK
oder muss ich verwendenregular expressions
? Kann ich benutzenregular expressions
innerhalb eines Python-Skripts?