Результаты поиска по запросу "cosine-similarity"
Mahout строкаСходство
Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в формате
, но блочная матрица все еще имеет 1003043309L столбцов и строк. Но для небольшого примера, приведенного в вопросе, у меня нет этой проблемы
я есть набор данных, содержащий работников с их демографической информацией, такой как возраст, пол, адрес и т. Д., А также место их работы. Я создал RDD из набора данных и преобразовал его в DataFrame. Есть несколько записей для каждого ...
Mahout: скорректированное сходство косинусов для рекомендателя на основе предметов
Для задания я должен протестировать различные типы рекомендаций, которые я должен реализовать в первую очередь. Я искал хорошую библиотеку для этого (сначала...
Сходство косинусов между двумя числовыми списками
Мне нужно рассчитатькосинусное сходствомеждудва спискаскажем, например, список 1, которыйdataSetI и список 2, которыйdataSetII, Я не могу использовать что-либо, напримерNumPy или модуль статистики. Я должен использовать общие модули ...
Косинусное расстояние как векторная функция расстояния для k-средних
У меня есть график N вершин, где каждая вершина представляет место. Также у меня есть векторы, по одному на пользователя, каждый из N коэффициентов, где знач...
Можете ли вы интерпретировать результаты матрицыEntry? как то, что 0 и 2?
истемы Рекомендатора мне нужно вычислить косинусное сходство между всеми столбцами целого Фрейма данных Spark.В Пандах я делал это:
Mahout строкаСходство
Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...
Рассчитать косинусное сходство по 2 строкам предложения
ИзPython: tf-idf-cosine: найти сходство документа [https://stackoverflow.com/questions/12118720/python-tf-idf-cosine-to-find-document-similarity] , можно рассчитать сходство документов, используя косинус tf-idf. Без импорта внешних библиотек, ...
Какой самый быстрый способ в Python для вычисления косинусного сходства, учитывая разреженные данные матрицы?
Учитывая разреженный список матриц, каков наилучший способ вычисления косинусного сходства между каждым из столбцов (или строк) в матрице? Я бы предпочел не повторять n-выбирать-два раза. Скажем, входная матрица: A= [0 1 0 0 1 0 0 1 1 1 1 1 0 1 ...
Как эффективно извлечь главные K-подобные векторы по косинусному подобию, используя R?
Я работаю над многомерной задачей (~ 4k терминов) и хотел бы получить верхнее k-подобное (по косинусному сходству) и не могу позволить себе выполнить попарный расчет. Мой тренировочный набор имеет матрицу 6 миллионов x 4 тысячи, и я хотел ...
Страница 1 из 2