Результаты поиска по запросу "cosine-similarity"

1 ответ

Mahout строкаСходство

Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в формате

1 ответ

, но блочная матрица все еще имеет 1003043309L столбцов и строк. Но для небольшого примера, приведенного в вопросе, у меня нет этой проблемы

я есть набор данных, содержащий работников с их демографической информацией, такой как возраст, пол, адрес и т. Д., А также место их работы. Я создал RDD из набора данных и преобразовал его в DataFrame. Есть несколько записей для каждого ...

1 ответ

Mahout: скорректированное сходство косинусов для рекомендателя на основе предметов

Для задания я должен протестировать различные типы рекомендаций, которые я должен реализовать в первую очередь. Я искал хорошую библиотеку для этого (сначала...

ТОП публикаций

10 ответов

Сходство косинусов между двумя числовыми списками

Мне нужно рассчитатькосинусное сходствомеждудва спискаскажем, например, список 1, которыйdataSetI и список 2, которыйdataSetII, Я не могу использовать что-либо, напримерNumPy или модуль статистики. Я должен использовать общие модули ...

3 ответа

Косинусное расстояние как векторная функция расстояния для k-средних

У меня есть график N вершин, где каждая вершина представляет место. Также у меня есть векторы, по одному на пользователя, каждый из N коэффициентов, где знач...

1 ответ

Можете ли вы интерпретировать результаты матрицыEntry? как то, что 0 и 2?

истемы Рекомендатора мне нужно вычислить косинусное сходство между всеми столбцами целого Фрейма данных Spark.В Пандах я делал это:

1 ответ

Mahout строкаСходство

Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...

5 ответов

Рассчитать косинусное сходство по 2 строкам предложения

ИзPython: tf-idf-cosine: найти сходство документа [https://stackoverflow.com/questions/12118720/python-tf-idf-cosine-to-find-document-similarity] , можно рассчитать сходство документов, используя косинус tf-idf. Без импорта внешних библиотек, ...

9 ответов

Какой самый быстрый способ в Python для вычисления косинусного сходства, учитывая разреженные данные матрицы?

Учитывая разреженный список матриц, каков наилучший способ вычисления косинусного сходства между каждым из столбцов (или строк) в матрице? Я бы предпочел не повторять n-выбирать-два раза. Скажем, входная матрица: A= [0 1 0 0 1 0 0 1 1 1 1 1 0 1 ...

1 ответ

Как эффективно извлечь главные K-подобные векторы по косинусному подобию, используя R?

Я работаю над многомерной задачей (~ 4k терминов) и хотел бы получить верхнее k-подобное (по косинусному сходству) и не могу позволить себе выполнить попарный расчет. Мой тренировочный набор имеет матрицу 6 миллионов x 4 тысячи, и я хотел ...