Генерация случайных предложений из пользовательского текста в NLTK Python?

Question

Jul 19, 2009, 10:20 PM

Генерация случайных предложений из пользовательского текста в NLTK Python?

У меня проблемы с NLTK под Python, в частности с методом .generate ().

generate(self, length=100)

Print random text, generated using a trigram language model.

Parameters:

   * length (int) - The length of text to generate (default=100)

Вот упрощенная версия того, что я пытаюсь сделать.

import nltk

words = 'The quick brown fox jumps over the lazy dog'
tokens = nltk.word_tokenize(words)
text = nltk.Text(tokens)
print text.generate(3)

Это будетalways генерировать

Building ngram index...
The quick brown
None

В отличие от построения случайной фразы из слов.

Вот мой вывод, когда я делаю

print text.generate()

Building ngram index...
The quick brown fox jumps over the lazy dog fox jumps over the lazy
dog dog The quick brown fox jumps over the lazy dog dog brown fox
jumps over the lazy dog over the lazy dog The quick brown fox jumps
over the lazy dog fox jumps over the lazy dog lazy dog The quick brown
fox jumps over the lazy dog the lazy dog The quick brown fox jumps
over the lazy dog jumps over the lazy dog over the lazy dog brown fox
jumps over the lazy dog quick brown fox jumps over the lazy dog The
None

Опять начинаем с того же текста, но потом меняем его. Я также пытался использовать первую главу из Оруэлла 1984 года. Опять же, чтоalways начинается с первых 3 токенов (один из которых в данном случае является пробелом) иthen продолжает случайным образом генерировать текст.

Что я здесь не так делаю?

Генерация случайных предложений из пользовательского текста в NLTK Python?

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Генерация случайных предложений из пользовательского текста в NLTK Python?

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы