Результаты поиска по запросу "tokenize"

3 ответа

Токенизация юникода с использованием nltk

У меня есть текстовые файлы, использующие кодировку utf-8 и содержащие такие символы, как 'ö', 'ü' и т. Д. Я хотел бы проанализировать текст этих файлов, но я не могу заставить токенайзер работать должным образом. Если я использую стандартный ...

4 ответа

Базовый НЛП в CoffeeScript или JavaScript - Punkt tokenizaton, простые обученные модели Байеса - с чего начать? [закрыто]

Мой текущий проект веб-приложения требует немного НЛП: Токенизация текста в предложения через Punkt и т. П .;Разбивка более длинных предложений по подчиненному предложению (часто это запятые, кроме случаев, когда это не так)Байесовская модель, ...

5 ответов

C ++ токенизирует строку с помощью регулярного выражения

Я пытаюсь изучить C ++ с нуля на данный момент. Я хорошо разбираюсь в python, perl, javascript, но в прошлом встречался только с C ++ в классной комнате. Прошу прощения за наивность моего вопроса. Я хотел бы разбить строку с помощью регулярного ...

ТОП публикаций

3 ответа

Как индексировать таблицу postgres по имени, если имя может быть на любом языке?

У меня есть большая таблица местоположений (магазины, достопримечательности и т. Д.), Которые пользователь может искать различными способами. Когда пользователь хочет выполнить поиск по названию места, система в настоящее время делает это (при ...

2 ответа

функция listunagg?

есть ли такая вещь в оракуле, как функция listunagg? Например, если у меня есть данные вроде: ------------------------------------------------------------ | user_id | degree_fi | degree_en | degree_sv ...

1 ответ

Получить проанализированные токены из документов ElasticSearch

Попытка доступа к проанализированному / токенизированному тексту в моих документах ElasticSearch. Я знаю, что вы можете использоватьАнализ API [http://www.elasticsearch.org/guide/reference/api/admin-indices-analyze.html] анализировать ...

4 ответа

Парсинг классов, функций и аргументов в PHP

Я хочу создать функцию, которая получает единственный аргумент, который содержит путь к файлу PHP, а затем анализирует данный файл и возвращает что-то вроде этого: class NameOfTheClass function Method1($arg1, $arg2, $arg2) private ...

13 ответов

Разбиение строки на несколько строк в Oracle

Я знаю, что на это в некоторой степени ответили с помощью PHP и MYSQL, но мне было интересно, может ли кто-нибудь научить меня простейшему подходу к разбиению строки (через запятую) на несколько строк в Oracle 10g (предпочтительно) и ...

6 ответов

как получить данные между кавычками в Java?

У меня есть эти строки текста, количество цитат может измениться так: Here just one "comillas" But I also could have more "mas" values in "comillas" and that "is" the "trick" I was thinking in a method that return "a" list of "words" that "are" ...

4 ответа

Есть ли в PL / SQL эквивалент StringTokenizer для Java?

Я использую java.util.StringTokenizer для простого анализа строк с разделителями в Java. У меня есть потребность в механизме такого же типа в pl / sql. Я мог бы написать это, но если он уже существует, я бы предпочел использовать это. Кто-нибудь ...