Búsqueda de Lucene y guiones bajos
Cuando usoLuke para buscar mi índice de Lucene usando un analizador estándar, puedo ver que el campo que estoy buscando contiene valores de la forma MY_VALUE. Sin embargo, cuando busco el campo: "MY_VALUE", la consulta se analiza como campo: "mi valor"
¿Hay una manera simple de escapar del carácter de subrayado (_) para que lo busque?
EDITAR:
4/1/2010 11:08 AM PST
Creo que hay un error en el tokenizer para Lucene 2.9.1 y probablemente ya estaba allí antes. Cargue Luke e intente buscar "BB_HHH_FFFF5_SSSS", cuando hay un número, se devuelven los siguientes tokens:
"bb hhh_ffff5_ssss"
Después de algunas pruebas, descubrí que esto se debe al número. Si ingreso
"BB_HHH_FFFF_SSSS", obtengo
"bb hhh ffff ssss"
En este punto, me inclino hacia un error de tokenizador a menos que se suponga que la presencia del número tiene este comportamiento, pero no veo por qué.
¿Alguien puede confirmar esto?