Мешок визуальных слов в Opencv

Я использую BOW в opencv для кластеризации функций переменного размера. Однако из документации opencv неясно одно, и я не могу найти причину этого вопроса:

предположим: размер словаря = 100

Я использую surf для вычисления объектов, и каждое изображение имеет дескрипторы переменного размера, например: 128 x 34, 128 x 63 и т. Д. Теперь в BOW каждый из них сгруппирован, и я получаю фиксированный размер дескриптора 128 x 100 для изображения. Я знаю, что 100 - это кластерный центр, созданный с использованием кластеров kmeans.

Но меня смущает то, что если изображение имеет 128 x 63 дескрипторов, то почему получается, что оно группируется в 100 кластеров, что невозможно с помощью kmeans, ЕСЛИ Я не преобразую матрицу дескрипторов в 1D. Не будет ли преобразование в 1D потерять достоверную 128-мерную информацию об отдельных ключевых точках?

Мне нужно знать, как манипулировать матрицей дескриптора, чтобы получить 100 центров кластера только из 63 объектов.

Ответы на вопрос(1)

Ваш ответ на вопрос