Результаты поиска по запросу "hamming-distance"

3 ответа

Дистанция Хемминга / Поиск сходства в базе данных

У меня есть процесс, похожий на tineye, который генерирует перцептивные хэши, это 32-битные числа. Я намерен хранить их в базе данных sql (может быть, nosql db) в будущем Тем не менее, я озадачен тем, как я мог бы получать записи, основываясь ...

1 ответ

Запросы указывают на вершины куба Хемминга

У меня есть N точек, которые лежат только на вершинах куба, размерности D, где D - что-то вроде 3. Вершина может не содержать никакой точки. Таким образом, каждая точка имеет координаты в {0, 1}D. Меня интересует только время запроса, если ...

4 ответа

Как найти ближайшие пары (расстояние Хэмминга) строки двоичных бинов в Ruby без проблем O ^ 2?

У меня есть MongoDB с около 1 миллиона документов. Во всех этих документах есть строка, представляющая 256-битный набор значений 1 и 0, например: 0110101010101010110101010101 В идеале я хотел бы запросить близкие двоичные совпадения. Это ...

ТОП публикаций

3 ответа

@din Ах, я упустил из виду тот факт, что результат не может содержать одинаковые векторы. Во всяком случае, я видел ваш вопрос довольно поздно, и я все еще перевариваю все детали проблемы. Я, вероятно, обновлю свой ответ в ближайшие дни. Вы заинтересованы в создании всех решений или только одного случайного решения за раз, и важно ли равномерное распределение?

отрим набор,Sвсех двоичных векторов длиныn где каждый содержит точноm из них; так что естьн-м нули в каждом векторе. Моя цель - построить число,k, векторов изS так что эти векторы максимально отличаются друг от друга. В качестве простого примера ...

1 ответ

"имеет только алгоритмы, включающие фактор n ^ 2 (если только K не очень большой). Это даже для нахождения только одной пары. Поэтому кажется, что это трудно улучшить, если вы не сделаете дополнительных предположений о структуре ваших экземпляров. Например, если вы предполагаете, что расстояние Хэмминга не очень велико, вы можете выбрать несколько столбцов, хешировать строки в сегменты в соответствии с ними в предположении, что эти столбцы точно совпадают, а затем выполнить попарное сравнение в каждом сегменте в отдельности. для другого набора случайных столбцов, чтобы минимизировать вероятность того, что вы пропустите некоторые пары.

емаПредположим, что у вас есть N (~ 100k-1m) целых / битовых строк каждая K (например, 256) бит длиной. Алгоритм должен возвращать k пар с наименьшим парным расстоянием Хэмминга. примерN = 4 K = 8 i1 = 00010011 i2 = 01010101 i3 = 11000000 i4 = ...

1 ответ

Алгоритм для проверки минимального расстояния Хемминга против набора?

У меня есть относительно простая вещь, которую я хочу сделать:Учитывая номер запроса Q, расстояние запроса d и набор чисел S, определяют, содержит ли Sлюбой ...

4 ответа

 инструкции вместо того, чтобы использовать таблицу для создания попконта. В моей системе это было примерно в 2,5 раза быстрее.

y, каков наиболее эффективный способ вычисления разницы в битах между двумя целыми числами без знака (например, расстоянием Хэмминга)? Например, у меня есть целое число a = 2323409845 и b = 1782647144. Их двоичные представления: a = ...

1 ответ

XOR bitset, когда 2D bitset сохраняется как 1D

ОтвечатьКак хранить двоичные данные, когда вы заботитесь только о скорости?Я пытаюсь написать некоторые для сравнения, поэтому я хочу использовать

4 ответа

Быстрый Хэмминговский зачет

Существует база данных с N строками фиксированной длины. Есть строка запроса той же длины. Проблема состоит в том, чтобы получить первые k строк из базы данн...

2 ответа

, что соответствует количеству единиц в

я есть таблица в моей БД, где я храню хэши SHA256 в столбце BINARY (32). Я ищу способ для вычисления расстояния Хэмминга записей в столбце до предоставленного значения, то есть что-то вроде: SELECT * FROM table ORDER BY HAMMINGDISTANCE(hash, ...