Результаты поиска по запросу "data-mining"
Redis определенно не будет быстрее, чем нативная Java на одной машине. Это позволит вам распределить обработку, но если куски данных действительно велики, они вряд ли уместятся в памяти в любом случае. Не зная больше о том, что вы делаете, я бы посоветовал хранить данные на диске. Когда вы получаете несколько машин, вы можете смонтировать раздел по сети и обмениваться данными таким образом. Кроме того, Hadoop с MapReduce звучит как то, что вы делаете.
ает ли Redis с Java разрабатывать приложения с интенсивным использованием данных (например, интеллектуальный анализ данных) на Java? Работает ли он быстрее или потребляет меньше памяти по сравнению с простой Java для аналогичной работы с большим ...
mlpy - динамическая деформация времени зависит от x?
Я пытаюсь получить расстояние между этими двумя массивами, показанными ниже DTW. Я использую питонmlpy пакет, который предлагает dist, cost, path = mlpy.dtw_std(y1, y2, dist_only=False)Я понимаю, что DTW заботится о «сдвиге». Кроме того, как ...
Исторические данные о погоде от NOAA
Я работаю над проектом интеллектуального анализа данных и хотел бы собрать исторические данные о погоде. Я могу получить исторические данные через веб-интерфейс, который они предоставляют ...
В чем разница между матрицей путаницы и таблицей непредвиденных обстоятельств?
Я пишу кусок кода для оценки моего алгоритма кластеризации, и я обнаружил, что для каждого метода оценки нужны базовые данные изm*n как матрицаA = {aij} гдеaij это количество точек данных, которые являются членами классаci и ...
Алгоритмы веб-майнинга
Мой старший проект определяет доминирующую категорию веб-страницы. Я сканировал dmoz. сейчас я пытаюсь построить Arff. После этого я буду использовать некоторые методы извлечения признаков и алгоритмы классификации. Знаете ли вы, какой ...
Как работать с ROC-анализом нескольких классов в R (пакет pROC)?
Например, когда я использую функцию multiclass.roc в R (пакет pROC), я обучил набор данных случайным лесом, вот мой код: # randomForest & pROC packages should be installed: # install.packages(c('randomForest', 'pROC')) data(iris) ...
FCM Кластеризация числовых данных и файла csv / excel
Привет, я задал предыдущий вопрос, который дал разумный ответ, и я подумал, что вернулся на путь,Нечеткая кластеризация дампов c-означает tcp в ...
Как работает кластеризация (особенно кластеризация строк)?
Я слышал о кластеризации для группировки похожих данных. Я хочу знать, как это работает в конкретном случае для String. У меня есть таблица с более чем 100 000 разных слов. Я хочу идентифицировать одно и то же слово с некоторыми ...
Алгоритм кластеризации с дискретными и непрерывными атрибутами?
Кто-нибудь знает хороший алгоритм для выполнения кластеризации по дискретным и непрерывным атрибутам? Я работаю над проблемой идентификации группы схожих клиентов, и у каждого клиента есть как дискретные, так и непрерывные атрибуты (тип клиентов, ...
Weka GUI - Недостаточно памяти, не загружается?
Эта же установка Weka была загружена для меня в прошлом. Я просто пытаюсь загрузить Weka GUI (двойной щелчок по значку), и я получаю следующую ошибку. Как я могу это исправить? OutOfMemory Not enough memory. Please load a smaller dataset or use ...