Suchergebnisse für Anfrage "nltk"

3 die antwort

Erkennung benannter Entitäten mit regulärem Ausdruck: NLTK

Ich habe mit dem NLTK-Toolkit gespielt. Ich bin häufig auf dieses Problem gestoßen und habe online nach einer Lösung gesucht, aber nirgendwo habe ich eine befriedigende Antwort bekommen. Also stelle ich meine Frage hier. Häufig kennzeichnet NER ...

4 die antwort

Wie extrahiert man Substantive mit NLTK pos_tag ()?

Ich bin ziemlich neu in Python. Ich kann den Fehler nicht herausfinden. Ich möchte Substantive mit NLTK extrahieren. Ich habe folgenden Code geschrieben: import nltk sentence = "At eight o'clock on Thursday film morning word line test best ...

4 die antwort

So extrahieren Sie häufige / signifikante Ausdrücke aus einer Reihe von Texteingaben

Ich habe eine Reihe von Textelementen - rohes HTML aus einer MySQL-Datenbank. Ich möchte die häufigsten Ausdrücke in diesen Einträgen finden (nicht die häufigste Einzelphrase und im Idealfall keine Wort-für-Wort-Übereinstimmung erzwingen). Mein ...

TOP-Veröffentlichungen

6 die antwort

Was ist die beste Stemming-Methode in Python?

Ich habe alle nltk-Methoden zum Stemming ausprobiert, aber es gibt mir seltsame Ergebnisse mit einigen Worten. Beispiele Es schneidet oft das Ende von Wörtern ab, wenn es das nicht tun sollte: Pudel => Pudelartikel artikeloder stammt nicht ...

3 die antwort

Wie drucke ich mit Python NLTK nur das Wort selbst in einem WordNet-Synset aus?

Gibt es einen Weg in Python 2.7 mitNLTK um nur das Wort zu verstehen und nicht die zusätzliche Formatierung, die dies beinhaltet"synset" und die Klammern und die"n.01" usw? Zum Beispiel, wenn ich es tue wn.synsets('dog')Meine Ergebnisse sehen ...

5 die antwort

NLTK 3 POS_TAG löst UnicodeDecodeError @ a

Hi, ich versuche NLTK zu lernen. Ich bin auch neu in Python. Ich versuche folgendes. >>import nltk >>nltk.pos_tag(nltk.word_tokenize("John lived in China"))Ich erhalte die folgende Fehlermeldung Traceback (letzter Aufruf zuletzt): Datei "", ...

1 die antwort

NLTK Baum Datenstruktur, Finden eines Knotens, seines Elternteils oder seiner Kinder

Ich verwende die Tree-Datenstruktur von nltk, um mit Parsetree-Strings zu arbeiten. from nltk.tree import Tree parsed = Tree('(ROOT (S (NP (PRP It)) (VP (VBZ is) (ADJP (RB so) (JJ nice))) (. .)))') Die Datenstruktur scheint jedoch begrenzt ...

4 die antwort

AttributeError: Objekt 'FreqDist' hat kein Attribut 'inc'

ch bin ein Anfänger in Python und NLTK. Ich versuche, den folgenden Code in einem Lernprogramm auszuführen: from nltk.corpus import gutenberg from nltk import FreqDist fd = FreqDist() for word in gutenberg.words('austen-sense.txt'): ...

2 die antwort

Tupel mit nltk extrahieren?

eim Lesen der Dokumentation von nltk habe ich festgestellt, dass es möglich ist, Tupel mit @ zu extrahierestr2tuple(). Als Beispiel nehme ich an, ich habe den folgenden Satz (eindeutig ist eine viel größere Datei): sent = "pero pero CC " \ "tan ...

1 die antwort

sklearn: So beschleunigen Sie einen Vektorisierer (z. B. Tfidfvectorizer)

achdem ich mein Programm gründlich analysiert habe, konnte ich feststellen, dass es vom Vectorizer verlangsamt wir Ich arbeite an Textdaten, und zwei Zeilen der einfachen tfidf-Unigramm-Vektorisierung beanspruchen 99,2% der Gesamtzeit, die der ...