http://en.wikipedia.org/wiki/Locality_sensitive_hashing

я есть поиск в solr, который возвращает около 1500 документов. Эти документы в основном продукты. Например, у меня в наборе данных куча женской обуви. В моем наборе данных представлен широкий ассортимент обуви для женщин, но он также дает очень похожие результаты, например, женские кроссовки Nike 11-го размера, женские кроссовки NIKE 10-го размера и т.д. вызывает появление определенного набора этих результатов, которые очень похожи друг на друга. Например, все цвета одной конкретной модели обуви могут достигать вершины. Это, безусловно, разные продукты, но я бы предпочел получить более широкий спектр результатов, чем просто каждый цвет кроссовок Nike.

У кого-нибудь есть предложения? Обратите внимание, я не хочу исключать все индивидуально окрашенные продукты. Когда кто-то ищет синие женские кроссовки, я хочу, чтобы они получили синюю модель как лучший результат. Я использую запрос dismax в качестве основного запроса. То, что я хотел бы сделать, это в основном повысить некоторый фактор «уникальности имени по сравнению с другими результатами».

Ответы на вопрос(1)

Ваш ответ на вопрос