Результаты поиска по запросу "text-segmentation"

4 ответа

В поисках открытой реализации обнаружения плагиата, которая может быть с китайским.

формулировано в вопросе, я ищу бесплатный и / или открытый текстовый алгоритм сегментации текста для китайского языка, я понимаю, что это очень трудная задача, так как возникает много двусмысленностей. Я знаю, что есть API Google, но это скорее ...

1 ответ

Вы можете попробовать это сделать:

аюсь преобразовать строку в список слов, используя Python. Я хочу взять что-то вроде следующего: string = 'This is a string, with words!'Затем преобразуйте во что-то вроде этого: list = ['This', 'is', 'a', 'string', 'with', 'words']Обратите ...

3 ответа

регулярное выражение для извлечения предложения из абзаца в Python

Я пытаюсь извлечь предложение из абзаца, используя регулярные выражения в Python. Обычно код, который я тестирую, правильно извлекает предложение, но в следующем параграфе предложение извлекается неправильно. Параграф: «Но в случае малярийных ...

ТОП публикаций

2 ответа

Статистический подход с разделением слов

Я хочу решить проблему разделения слов (разбирать слова из длинной строки без пробелов). Например, мы хотим извлечь слова изsomelongword в[some, long, word]. Мы можем добиться этого с помощью некоторого динамического подхода со словарем, но ...

5 ответов

Регулярное выражение, чтобы соответствовать первое слово в предложении

Я ищу регулярное выражение, соответствующее первому слову в предложении, исключая знаки препинания и пробелы. Например: «Это» в «Это предложение». и «Первый» в «Во-первых, я бы хотел сказать« Привет! »» Это не ...

2 ответа

Разделение абзацев на предложения с помощью регулярных выражений и PHP

Я регулярный пользователь noob и пытаюсь разбить абзацы на предложения. В моем языке мы используем довольно много сокращений (например, bl.a.) в середине предложений, поэтому я пришел к выводу, что мне нужно искать знаки препинания, за которыми ...