Suchergebnisse für Anfrage "nltk"

4 die antwort

welche tokenizer ist besser mit nltk @ verwendet werd

Ich habe angefangen zu lernennltk und folgendeDie [https://py,thonprogramming.net/stop-words-nltk-tutorial/?completed=/tokenizing-words-sentences-nltk-tutorial/] Lernprogramm. Zuerst benutzen wir den eingebauten Tokenizer mitsent_tokenize ...

6 die antwort

Wie kann ich mit NLTK in Python Adressen aus Rohtext extrahieren?

Ich habe diesen Text '' 'Hallo, Herr Sam D. Richards wohnt hier, 44 West 22nd Street, New York, NY 12345. Können Sie ihn jetzt kontaktieren? Wenn Sie Hilfe benötigen, rufen Sie mich an unter 12345678 '' ' . Wie kann der Adressteil mit NLTK aus ...

4 die antwort

Tokenize einen Absatz in Satz und dann in Wörter in NLTK

Ich versuche, einen ganzen Absatz in mein Textverarbeitungsprogramm einzugeben, um ihn zuerst in Sätze und dann in Wörter aufzuteilen. Ich habe den folgenden Code ausprobiert, aber er funktioniert nicht. #text is the paragraph input sent_text ...

TOP-Veröffentlichungen

4 die antwort

Wie bekomme ich einen Knoten in einem Baum nach seiner Bezeichnung in nltk Python?

Ich habe einen Baum: (S (WH-QUERY Which) (FLIGHT-NP (FLIGHT-CNP (FLIGHT-CNP (FLIGHT-N flight)) (FLIGHT-DEST to (CITY-NP (CITY-NAME Hue) (CITY-N city))))) (FLIGHT-VP (FLIGHT-V arrives) (FLIGHT-TIME (P-TIME at) (TIME-MOD 20:00HR))))Ich möchte ...

2 die antwort

Wie finde ich die n-Gramm-Häufigkeit einer Spalte in einem Pandas-Datenrahmen?

Below ist der Eingabepandas-Datenrahmen, den ich habe. [/imgs/ltSrD.png] Ich möchte die Häufigkeit von Unigrammen und Bigrammen ermitteln. Ein Beispiel von dem, was ich erwarte, ist unten gezeigt [/imgs/7NOKk.png] Wie mache ich das mit nltk ...

4 die antwort

nltk fügt dem Suchpfad nicht $ NLTK_DATA hinzu?

nter Linux habe ich env var $ NLTK_DATA ('/ home / user / data / nltk') gesetzt und der Blästest funktioniert wie erwartet >>> from nltk.corpus import brown >>> brown.words() ['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...] Aber wenn ...

4 die antwort

Stanford NER in NLTK markiert mehrere Sätze nicht richtig - Python

Ich habe eine Funktion, die die benannten Entitäten in einem bestimmten Textkörper mit der Stanford-NER zurückgibt. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...

2 die antwort

NLTK: lemmatizer und pos_tag [duplizieren]

Diese Frage hat hier bereits eine Antwort: wordnet Lemmatisierung und Pos Tagging in Python [/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python] 6 answers Ich baue einen Plaintext-Corpus und der nächste Schritt ist, alle meine ...

6 die antwort

NLTK v3.2: nltk.pos_tag () kann nicht

Hi Text Mining Champions, Ich verwende Anaconda mit NLTK v3.2 unter Windows 10. (Client-Umgebung) Wenn ich versuche, ein POS-Tag zu erstellen, erhalte ich immer wieder einen URLLIB2-Fehler: URLError: <urlopen error unknown url type: c> Es ...

2 die antwort

Python NLTK pos_tag wirft URLError

Ich habe versucht, das @ zu verwendpos_tag -Funktion in NLTK 3 (unter Windows), aber dieser Fehler ist aufgetreten: >>> import nltk >>> tokens = nltk.word_tokenize("This is a sentence!") >>> tokens ['This', 'is', 'a', 'sentence', '!'] >>> tags ...