Результаты поиска по запросу "data-mining"

2 ответа

Использовать абсолютную корреляцию Пирсона в качестве расстояния в алгоритме K-средних (MATLAB)

4 ответа

В scikit-learn, DBSCAN может использовать разреженную матрицу?

Я получил ошибку памяти, когда я запускал алгоритм dbscan от scikit. Мои данные около 20000 * 10000, это двоичная матрица. (Может быть, не подходит использовать DBSCAN с такой матрицей. Я новичок в машинном обучении. Я просто хочу найти ...

2 ответа

Написание правил, сгенерированных Apriori

Я работаю с некоторыми большими данными транзакций. Я использую read.transactions и apriori (части пакета arules) для поиска часто встречающихся предметов. Моя проблема заключается в следующем: когда правила генерируются (с использованием ...

ТОП публикаций

5 ответов

scikit-Learn Использование памяти DBSCAN

ОБНОВЛЕНО:В конце концов, решение, которое я решил использовать для кластеризации своего большого набора данных, было предложено Anony-Mousse ниже. То есть, используя ELSCI DBSCAN для выполнения моей кластеризации, а не scikit-learn. Его можно ...

10 ответов

Может ли кто-нибудь привести пример сходства косинусов очень простым графическим способом?

Статья о косинусном сходстве в Википедии [http://en.wikipedia.org/wiki/Cosine_similarity] Можете ли вы показать векторы здесь (в виде списка или еще чего-нибудь), а затем выполнить математику, и давайте посмотрим, как это работает? Я новичок

2 ответа

Почему одно горячее кодирование улучшает производительность машинного обучения?

Я заметил, что когда кодирование One Hot используется в конкретном наборе данных (матрице) и используется в качестве обучающих данных для алгоритмов обучения, это дает значительно лучшие результаты в отношении точности прогнозирования ...

3 ответа

как определить количество тем для LDA?

Я новичок в LDA, и я хочу использовать его в своей работе. Однако появляются некоторые проблемы. Чтобы получить наилучшую производительность, я хочу оценить лучший номер темы. После прочтения «Поиск научных тем» я знаю, что сначала могу ...

3 ответа

кластеризация очень большой набор данных в R

У меня есть набор данных, состоящий из 70000 числовых значений, представляющих расстояния в диапазоне от 0 до 50, и я хочу сгруппировать эти числа; однако, е...

3 ответа

Использовать обратную связь или подкрепление в машинном обучении?

Я пытаюсь решить некоторые проблемы классификации. Кажется, многие классические подходы придерживаются аналогичной парадигмы. То есть тренируйте модель с нек...

1 ответ

Использование функции расстояния ELKI

Это продолжение отпредыдущий вопросгде мы отметили, что использование евклидовых расстояний с широтой, длинные координаты не дают правильных результатов. Я п...