Suchergebnisse für Anfrage "nltk"
welche tokenizer ist besser mit nltk @ verwendet werd
Ich habe angefangen zu lernennltk und folgendeDie [https://py,thonprogramming.net/stop-words-nltk-tutorial/?completed=/tokenizing-words-sentences-nltk-tutorial/] Lernprogramm. Zuerst benutzen wir den eingebauten Tokenizer mitsent_tokenize ...
Wie kann ich mit NLTK in Python Adressen aus Rohtext extrahieren?
Ich habe diesen Text '' 'Hallo, Herr Sam D. Richards wohnt hier, 44 West 22nd Street, New York, NY 12345. Können Sie ihn jetzt kontaktieren? Wenn Sie Hilfe benötigen, rufen Sie mich an unter 12345678 '' ' . Wie kann der Adressteil mit NLTK aus ...
Tokenize einen Absatz in Satz und dann in Wörter in NLTK
Ich versuche, einen ganzen Absatz in mein Textverarbeitungsprogramm einzugeben, um ihn zuerst in Sätze und dann in Wörter aufzuteilen. Ich habe den folgenden Code ausprobiert, aber er funktioniert nicht. #text is the paragraph input sent_text ...
Wie bekomme ich einen Knoten in einem Baum nach seiner Bezeichnung in nltk Python?
Ich habe einen Baum: (S (WH-QUERY Which) (FLIGHT-NP (FLIGHT-CNP (FLIGHT-CNP (FLIGHT-N flight)) (FLIGHT-DEST to (CITY-NP (CITY-NAME Hue) (CITY-N city))))) (FLIGHT-VP (FLIGHT-V arrives) (FLIGHT-TIME (P-TIME at) (TIME-MOD 20:00HR))))Ich möchte ...
Wie finde ich die n-Gramm-Häufigkeit einer Spalte in einem Pandas-Datenrahmen?
Below ist der Eingabepandas-Datenrahmen, den ich habe. [/imgs/ltSrD.png] Ich möchte die Häufigkeit von Unigrammen und Bigrammen ermitteln. Ein Beispiel von dem, was ich erwarte, ist unten gezeigt [/imgs/7NOKk.png] Wie mache ich das mit nltk ...
nltk fügt dem Suchpfad nicht $ NLTK_DATA hinzu?
nter Linux habe ich env var $ NLTK_DATA ('/ home / user / data / nltk') gesetzt und der Blästest funktioniert wie erwartet >>> from nltk.corpus import brown >>> brown.words() ['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...] Aber wenn ...
Stanford NER in NLTK markiert mehrere Sätze nicht richtig - Python
Ich habe eine Funktion, die die benannten Entitäten in einem bestimmten Textkörper mit der Stanford-NER zurückgibt. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print ...
NLTK: lemmatizer und pos_tag [duplizieren]
Diese Frage hat hier bereits eine Antwort: wordnet Lemmatisierung und Pos Tagging in Python [/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python] 6 answers Ich baue einen Plaintext-Corpus und der nächste Schritt ist, alle meine ...
NLTK v3.2: nltk.pos_tag () kann nicht
Hi Text Mining Champions, Ich verwende Anaconda mit NLTK v3.2 unter Windows 10. (Client-Umgebung) Wenn ich versuche, ein POS-Tag zu erstellen, erhalte ich immer wieder einen URLLIB2-Fehler: URLError: <urlopen error unknown url type: c> Es ...
Python NLTK pos_tag wirft URLError
Ich habe versucht, das @ zu verwendpos_tag -Funktion in NLTK 3 (unter Windows), aber dieser Fehler ist aufgetreten: >>> import nltk >>> tokens = nltk.word_tokenize("This is a sentence!") >>> tokens ['This', 'is', 'a', 'sentence', '!'] >>> tags ...