Lucene поиск и подчеркивание
Когда я используюЛюк для поиска в моем индексе Lucene с использованием стандартного анализатора я вижу поле, в котором я ищу, содержит значения вида MY_VALUE. Однако когда я ищу поле: «MY_VALUE», запрос анализируется как поле: «мое значение»
Есть ли простой способ избежать символа подчеркивания (_), чтобы он его искал?
РЕДАКТИРОВАТЬ:
01.04.2010 11:08 PST
Я думаю, что есть ошибка в токенизаторе для Lucene 2.9.1, и это, вероятно, было там прежде. Загрузите Люка и попробуйте найти «BB_HHH_FFFF5_SSSS», когда есть число, возвращаются следующие токены:
"bb hhh_ffff5_ssss"
После некоторого тестирования я обнаружил, что это из-за числа. Если я введу
"BB_HHH_FFFF_SSSS", я получаю
"BB HHH FFFF SSSS"
На данный момент, я склоняюсь к ошибке токенизатора, если только присутствие числа не должно иметь такого поведения, но я не понимаю, почему.
Кто-нибудь может это подтвердить?