Agregação de métrica do Elasticsearch: número de elementos na matriz

Eu quero fazer uma consulta / agregação bastante envolvida. Não vejo como porque comecei a trabalhar com o ES. Os documentos que tenho são mais ou menos assim:

{
  "keyword": "some keyword",
  "items": [
    {
      "name":"my first item",
      "item_property_1":"A",
      ( other properties here )
    },
    {
      "name":"my second item",
      "item_property_1":"B",
      ( other properties here )
    },
    {
      "name":"my third item",
      "item_property_1":"A",
      ( other properties here )
    }
  ]
  ( other properties... )
},
{
  "keyword": "different keyword",
  "items": [
    {
      "name":"cool item",
      "item_property_1":"A",
      ( other properties here )
    },
    {
      "name":"awesome item",
      "item_property_1":"C",
      ( other properties here )
    },
  ]
  ( other properties... )
},
( other documents... )

Agora, o que eu gostaria de fazer é contar, para cada palavra-chave, quantos itens existem para qual dos vários valores possíveis que a propriedade_1 pode ter. Ou seja, quero uma agregação de bucket que tenha a seguinte resposta:

{
  "keyword": "some keyword",
  "item_property_1_aggretation": [
    {
      "key":"A",
      "count": 2,
    },
    {
      "key":"B",
      "count": 1,
    }
  ]
},
{
  "keyword": "different keyword",
  "item_property_1_aggretation": [
    {
      "key":"A",
      "count": 1,
    },
    {
      "key":"C",
      "count": 1,
    }
  ]
},
( other keywords... )

Se forem necessários mapeamentos, você também pode especificar qual? Não tenho nenhum mapeamento não padrão, apenas joguei tudo lá.

EDIT: poupando o problema, postando aqui o PUT em massa para o exemplo anterior

PUT /test/test/_bulk
{ "index": {}}
{  "keyword": "some keyword",  "items": [    {      "name":"my first item",      "item_property_1":"A"    },    {      "name":"my second item",      "item_property_1":"B"    },    {      "name":"my third item",      "item_property_1":"A"     }  ]}
{ "index": {}}
{  "keyword": "different keyword",  "items": [    {      "name":"cool item",      "item_property_1":"A"    },    {      "name":"awesome item",      "item_property_1":"C"    }  ]}

EDIT2:

Eu apenas tentei isso:

POST /test/test/_search
{
    "size":2,
    "aggregations": {
        "property_1_count": {
            "terms":{
                "field":"item_property_1"
            }
        }
    }
}

e entendi:

"aggregations": {
   "property_1_count": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
         {
            "key": "a",
            "doc_count": 2
         },
         {
            "key": "b",
            "doc_count": 1
         },
         {
            "key": "c",
            "doc_count": 1
         }
      ]
   }
}

perto, mas sem charuto. Você pode ver o que está acontecendo, está passando por cima de cadaitem_property_1 independentemente dokeyword isso pertence a. Tenho certeza de que a solução envolve adicionar alguns mapeamentos corretamente, mas não consigo apontar o dedo. Sugestões?

EDIT3: Com base nisso:https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-nested-type.html Eu quero tentar adicionar umnested digite a propriedadeitems. Para fazer isso, tentei:

PUT /test/_mapping/test
{
    "test":{
        "properties": {
            "items": {
                "type": "nested",
                "properties": {
                    "item_property_1":{"type":"string"}
                }
            }
        }
    }
}

No entanto, isso retorna um erro:

{
   "error": "MergeMappingException[Merge failed with failures {[object mapping [items] can't be changed from non-nested to nested]}]",
   "status": 400
}

Isso pode ter a ver com o aviso nesse URL: "alterar um tipo de objeto para aninhado requer reindexação".

Então, como faço isso?

questionAnswers(1)

yourAnswerToTheQuestion