Результаты поиска по запросу "data-mining"
В scikit-learn, DBSCAN может использовать разреженную матрицу?
Я получил ошибку памяти, когда я запускал алгоритм dbscan от scikit. Мои данные около 20000 * 10000, это двоичная матрица. (Может быть, не подходит использовать DBSCAN с такой матрицей. Я новичок в машинном обучении. Я просто хочу найти ...
Написание правил, сгенерированных Apriori
Я работаю с некоторыми большими данными транзакций. Я использую read.transactions и apriori (части пакета arules) для поиска часто встречающихся предметов. Моя проблема заключается в следующем: когда правила генерируются (с использованием ...
scikit-Learn Использование памяти DBSCAN
ОБНОВЛЕНО:В конце концов, решение, которое я решил использовать для кластеризации своего большого набора данных, было предложено Anony-Mousse ниже. То есть, используя ELSCI DBSCAN для выполнения моей кластеризации, а не scikit-learn. Его можно ...
Может ли кто-нибудь привести пример сходства косинусов очень простым графическим способом?
Статья о косинусном сходстве в Википедии [http://en.wikipedia.org/wiki/Cosine_similarity] Можете ли вы показать векторы здесь (в виде списка или еще чего-нибудь), а затем выполнить математику, и давайте посмотрим, как это работает? Я новичок
Почему одно горячее кодирование улучшает производительность машинного обучения?
Я заметил, что когда кодирование One Hot используется в конкретном наборе данных (матрице) и используется в качестве обучающих данных для алгоритмов обучения, это дает значительно лучшие результаты в отношении точности прогнозирования ...
как определить количество тем для LDA?
Я новичок в LDA, и я хочу использовать его в своей работе. Однако появляются некоторые проблемы. Чтобы получить наилучшую производительность, я хочу оценить лучший номер темы. После прочтения «Поиск научных тем» я знаю, что сначала могу ...
кластеризация очень большой набор данных в R
У меня есть набор данных, состоящий из 70000 числовых значений, представляющих расстояния в диапазоне от 0 до 50, и я хочу сгруппировать эти числа; однако, е...
Использовать обратную связь или подкрепление в машинном обучении?
Я пытаюсь решить некоторые проблемы классификации. Кажется, многие классические подходы придерживаются аналогичной парадигмы. То есть тренируйте модель с нек...
Использование функции расстояния ELKI
Это продолжение отпредыдущий вопросгде мы отметили, что использование евклидовых расстояний с широтой, длинные координаты не дают правильных результатов. Я п...