Результаты поиска по запросу "n-gram"

2 ответа

Elasticsearch - EdgeNgram + выделение + term_vector = плохие выделения

Когда я использую анализатор с edgengram (min = 3, max = 7, front) + term_vector = with_positions_offsets С документом, имеющим текст = & quot; CouchDB & qu...

1 ответ

Как использовать CountVectorizerand () в sklearn, чтобы получить нграммы, которые содержат любые знаки препинания в качестве отдельных токенов?

я используюsklearn.feature_extraction.text.CountVectorizer вычислить н-грамм. Пример:

1 ответ

Я работал с R.3.4.1 и перешел на R3.3.3, теперь решение VCorpus работает для меня. И TM, и RWeka создают биграммы правильно.

ТОП публикаций

4 ответа

Нахождение нграмм в R и сравнение нграмм по всем корпорациям

8 ответов

Вычисление N граммов с использованием Python

Мне нужно было вычислить Unigrams, BiGrams и Trigrams для текстового файла, содержащего текст, такой как: "Муковисцидоз затрагивает 30 000 детей и молодых людей только в США. Вдыхание туманов с соленой водой может уменьшить гной и инфекцию, ...

8 ответов

Вычисление N граммов с использованием Python

Мне нужно было вычислить Unigrams, BiGrams и Trigrams для текстового файла, содержащего текст вроде: "Кистозный фиброз затрагивает 30 000 детей и молоды...

3 ответа

считая n-граммовую частоту в питоне nltk

У меня есть следующий код. Я знаю, что я могу использовать

0 ответов

Получение наиболее вероятных документов запроса с использованием фонетического фильтра в solr

4 ответа

Может ли поисковый модуль Drupal искать подстроку? (Частичный поиск)

2 ответа

Elasticsearch: найти совпадение подстроки