Результаты поиска по запросу "data-mining"
извлечение отношений из текста
Я хочу извлечь отношения из неструктурированного текста в виде (SUBJECT, OBJECT, ACTION) отношений,например,"Мальчик сидит на столе и ест курицудал бы м...
Точная реализация RandomForest в Weka 3.7
Изучив первоначальный документ Бреймана (2001), а также некоторые другие посты совета директоров, я немного запутался в фактической процедуре, используемой в реализации случайных лесов WEKA. Ни один из источников не был достаточно сложным, многие ...
Точная реализация RandomForest в Weka 3.7
Изучив первоначальный документ Бреймана (2001 г.), а также некоторые другие сообщения Правления, я немного запутался в фактической процедуре, используемой в ...
mlpy - динамическая деформация времени зависит от x?
Я пытаюсь получить расстояние между этими двумя массивами, показанными ниже DTW. Я использую питонmlpy пакет, который предлагает dist, cost, path = mlpy.dtw_std(y1, y2, dist_only=False)Я понимаю, что DTW заботится о «сдвиге». Кроме того, как ...
Кластеризация траекторий: какой метод кластеризации?
Как новичок в машинном обучении, у меня есть набор траекторий, которые могут быть различной длины. Я хочу объединить их, потому что некоторые из нихна самом деле тот же путьи они простоSEEM разныеиз-за шума. К тому же,невсе они изодинаковые ...
найти все два словосочетания, которые появляются в нескольких строках в наборе данных
Мы хотели бы запустить запрос, который возвращает две словосочетания, которые появляются в более чем одной строке. Так, например, возьмите строку «Данные ниндзя». Поскольку он присутствует в нескольких строках нашего набора данных, запрос должен ...
найти все два словосочетания, которые появляются в нескольких строках в наборе данных
Мы хотели бы запустить запрос, который возвращает две словосочетания, которые появляются в более чем одной строке. Так, например, возьми струнуData Ninja &qu...
dbscan - установка предела максимального диапазона кластера
По моему пониманию DBSCAN, вы можете указать эпсилон, скажем, 100 метров и - потому что DBSCAN учитываетПлотность-достижимость а такжене прямая плотность достижимости при поиске кластеров - в конечном итоге кластер, в котором максимальное ...
dbscan - установка предела максимального диапазона кластера
По моему пониманию DBSCAN, это 'Вы можете указать эпсилон, скажем, 100 метров и - потому что DBSCAN учитываетПлотность-достижимость а такжене прямая плот...
Почему одно горячее кодирование улучшает производительность машинного обучения?
Я заметил, что когда кодирование One Hot используется в конкретном наборе данных (матрице) и используется в качестве обучающих данных для алгоритмов обучения, это дает значительно лучшие результаты в отношении точности прогнозирования ...