Результаты поиска по запросу "tokenize"

2 ответа

Токенизируйте, удаляйте стоп-слова, используя Lucene с Java

Я пытаюсь токенизировать и удалить стоп-слова из текстового файла с Lucene. У меня есть это:

5 ответов

токенизировать строку, сохраняя разделители в Python

Есть ли эквивалент

1 ответ

Почему n +++ n действует, а n ++++ n - нет?

ТОП публикаций

2 ответа

Разрыв слова в языках без пробелов между словами (например, азиатский)?

Я бы хотел, чтобы полнотекстовый поиск MySQL работал с текстом на японском и китайском, а также на любом другом языке. Проблема заключается в том, что эти языки и, возможно, другие языки обычно не имеют пробелов между словами. Поиск бесполезен, ...

2 ответа

Boost :: tokenizer разделен точкой, но также содержит пустые поля

2 ответа

Токенизируйте, удаляйте стоп-слова, используя Lucene с Java

Я пытаюсь токенизировать и удалить стоп-слова из текстового файла с Lucene. У меня есть это: public String removeStopWords(String string) throws IOException { Set<String> stopWords = new HashSet<String>(); stopWords.add("a"); ...

4 ответа

неявное объявление функции ‘strtok_r ’[-Wimplicit-function-объявление] несмотря на включение <string.h>

У меня есть следующий код для токенизации строки, содержащей строки, разделенные

1 ответ

Как токенизировать только определенные слова в Lucene

Я использую Lucene для своего проекта, и мне нужен собственный анализатор.Код является:

10 ответов

Python - RegEx для разделения текста на предложения (предложение-токенизация) [дубликаты]

9 ответов

NSString токенизировать в Objective-C

Каков наилучший способ токенизации / разбиения строки NSSt в Objective-C?