Результаты поиска по запросу "data-mining"

1 ответ

Redis определенно не будет быстрее, чем нативная Java на одной машине. Это позволит вам распределить обработку, но если куски данных действительно велики, они вряд ли уместятся в памяти в любом случае. Не зная больше о том, что вы делаете, я бы посоветовал хранить данные на диске. Когда вы получаете несколько машин, вы можете смонтировать раздел по сети и обмениваться данными таким образом. Кроме того, Hadoop с MapReduce звучит как то, что вы делаете.

ает ли Redis с Java разрабатывать приложения с интенсивным использованием данных (например, интеллектуальный анализ данных) на Java? Работает ли он быстрее или потребляет меньше памяти по сравнению с простой Java для аналогичной работы с большим ...

2 ответа

mlpy - динамическая деформация времени зависит от x?

Я пытаюсь получить расстояние между этими двумя массивами, показанными ниже DTW. Я использую питонmlpy пакет, который предлагает dist, cost, path = mlpy.dtw_std(y1, y2, dist_only=False)Я понимаю, что DTW заботится о «сдвиге». Кроме того, как ...

1 ответ

Исторические данные о погоде от NOAA

Я работаю над проектом интеллектуального анализа данных и хотел бы собрать исторические данные о погоде. Я могу получить исторические данные через веб-интерфейс, который они предоставляют ...

ТОП публикаций

2 ответа

В чем разница между матрицей путаницы и таблицей непредвиденных обстоятельств?

Я пишу кусок кода для оценки моего алгоритма кластеризации, и я обнаружил, что для каждого метода оценки нужны базовые данные изm*n как матрицаA = {aij} гдеaij это количество точек данных, которые являются членами классаci и ...

1 ответ

Алгоритмы веб-майнинга

Мой старший проект определяет доминирующую категорию веб-страницы. Я сканировал dmoz. сейчас я пытаюсь построить Arff. После этого я буду использовать некоторые методы извлечения признаков и алгоритмы классификации. Знаете ли вы, какой ...

3 ответа

Как работать с ROC-анализом нескольких классов в R (пакет pROC)?

Например, когда я использую функцию multiclass.roc в R (пакет pROC), я обучил набор данных случайным лесом, вот мой код: # randomForest & pROC packages should be installed: # install.packages(c('randomForest', 'pROC')) data(iris) ...

1 ответ

FCM Кластеризация числовых данных и файла csv / excel

Привет, я задал предыдущий вопрос, который дал разумный ответ, и я подумал, что вернулся на путь,Нечеткая кластеризация дампов c-означает tcp в ...

3 ответа

Как работает кластеризация (особенно кластеризация строк)?

Я слышал о кластеризации для группировки похожих данных. Я хочу знать, как это работает в конкретном случае для String. У меня есть таблица с более чем 100 000 разных слов. Я хочу идентифицировать одно и то же слово с некоторыми ...

5 ответов

Алгоритм кластеризации с дискретными и непрерывными атрибутами?

Кто-нибудь знает хороший алгоритм для выполнения кластеризации по дискретным и непрерывным атрибутам? Я работаю над проблемой идентификации группы схожих клиентов, и у каждого клиента есть как дискретные, так и непрерывные атрибуты (тип клиентов, ...

3 ответа

Weka GUI - Недостаточно памяти, не загружается?

Эта же установка Weka была загружена для меня в прошлом. Я просто пытаюсь загрузить Weka GUI (двойной щелчок по значку), и я получаю следующую ошибку. Как я могу это исправить? OutOfMemory Not enough memory. Please load a smaller dataset or use ...