Результаты поиска по запросу "data-mining"
Я думал, что принял это. Но я обнаружил, что просто нажал кнопку upvote. Прости за это.
меня естьматрица сходства пользователя и пользователя, что некоторые строки имеют повторяющиеся значения иNaN userId 316 320 359 370 910 userId 316 1.0 0.500000 0.500000 0.500000 NaN 320 0.5 1.000000 0.242837 0.019035 0.031737 359 0.5 0.242837 ...
Используйте больше данных ...
аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...
Кластеризация массива 1D [дубликат]
Possible Duplicate: Cluster one-dimensional data optimally? Итак, скажем, у меня есть такой массив:
По большей части эти два вектора указывают в одном направлении (большие координаты будут доминировать над меньшими различиями в другой координате). Ожидается косинусное сходство ~ 1 (Помните, что cos (0) = 1)
ользую формулу косинусного сходства, чтобы рассчитать сходство между двумя векторами. Я пробовал два разных вектора, как это:Vector1 (-1237373741, 27, 1, 1, ...
Привет ~ действительно спасибо ~ но я меняю ссылку на файл. Так не могли бы вы показать мне демонстрацию ?? Я думаю, что мои данные что-то не так .. ХАХА Я не знаю, где у значения.
ользую пакет DTW в R., и я наконец закончил иерархическую кластеризацию. но я хочу построить кластер временных рядов отдельно, как показано на рисунке ниже.
Как можно использовать оценку плотности ядра в качестве одномерного метода кластеризации в обучении scikit?
Мне нужно сгруппировать простой одномерный набор данных в заданное количество кластеров. Технически это было бы ближе к разбивке или сортировке данных, поско...
Как проанализировать разреженную матрицу смежности?
Я исследую разреженные матрицы смежности, в которых большинство ячеек являются нулями, а некоторые здесь и там, каждое отношение между двумя ячейками имеет п...