Pattern Matching in der elastischen Suche?
Fortsetzung von meinem früherenPos, Ich habe die Abfrage gemäß femtoRgon's @ geändePos Einige Zeichen und Anker werden von der elastischen Suche nicht unterstützt.
Ich bin auf der Suche nach dem Muster "xxx-xx-xxxx", um mit @ nach Dokumenten mit Sozialversicherungsnummern zu sucheelastic search
.
Angenommen, ich möchte in indizierten Dokumenten alle Dokumente finden, deren Sozialversicherungsnummer mit dem Muster "xxx-xx-xxxx" übereinstimmt.
Beispielcode zum Indizieren des Dokuments:
InputStream is = null;
try {
is = new FileInputStream("/home/admin/Downloads/20121221.doc");
ContentHandler contenthandler = new BodyContentHandler();
Metadata metadata = new Metadata();
Parser parser = new AutoDetectParser();
parser.parse(is, contenthandler, metadata, new ParseContext());
}
catch (Exception e) {
e.printStackTrace();
}
finally {
if (is != null) is.close();
}
Beispielcode für die Suche nach
QueryBuilder queryBuilderFullText = null;
queryBuilderFullText = QueryBuilders.filteredQuery(QueryBuilders.matchAllQuery(),
FilterBuilders.regexpFilter("_all", "[0-9]{3}?[0-9]{2}?[0-9]{4}"));
SearchRequestBuilder requestBuilder;
requestBuilder = client.prepareSearch()
.setIndices(getDomainIndexId(project))
.setTypes(getProjectTypeId(project))
.setQuery(queryBuilderFullText);
SearchResponse response = requestBuilder.execute().actionGet(ES_TIMEOUT_MS);
SearchHits hits = response.getHits();
if (hits.getTotalHits() > 0) {
System.out.println(hits.getTotalHits());
} else {
return 0l;
}
Ich erhalte Treffer für:
45-555-5462
457-55-5462
4578-55-5462
457-55-54623
457-55-5462-23
Aber gemäß meiner Anforderung sollte nur "457-55-5462" zurückgegeben werden (basierend auf der Musterübereinstimmung "xxx-xx-xxxx").
Bitte hilfe.