Результаты поиска по запросу "tokenize"
Токенизируйте, удаляйте стоп-слова, используя Lucene с Java
Я пытаюсь токенизировать и удалить стоп-слова из текстового файла с Lucene. У меня есть это:
Разрыв слова в языках без пробелов между словами (например, азиатский)?
Я бы хотел, чтобы полнотекстовый поиск MySQL работал с текстом на японском и китайском, а также на любом другом языке. Проблема заключается в том, что эти языки и, возможно, другие языки обычно не имеют пробелов между словами. Поиск бесполезен, ...
Токенизируйте, удаляйте стоп-слова, используя Lucene с Java
Я пытаюсь токенизировать и удалить стоп-слова из текстового файла с Lucene. У меня есть это: public String removeStopWords(String string) throws IOException { Set<String> stopWords = new HashSet<String>(); stopWords.add("a"); ...
неявное объявление функции ‘strtok_r ’[-Wimplicit-function-объявление] несмотря на включение <string.h>
У меня есть следующий код для токенизации строки, содержащей строки, разделенные
Как токенизировать только определенные слова в Lucene
Я использую Lucene для своего проекта, и мне нужен собственный анализатор.Код является:
NSString токенизировать в Objective-C
Каков наилучший способ токенизации / разбиения строки NSSt в Objective-C?