histograma python one-liner
Existem muitas maneiras de escrever um programa Python que calcula um histograma.
Por histograma, quero dizer uma função que conta a ocorrência de objetos em umiterable
e gera as contagens em um dicionário. Por exemplo:
>>> L = 'abracadabra'
>>> histogram(L)
{'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2}
Uma maneira de escrever essa função é:
def histogram(L):
d = {}
for x in L:
if x in d:
d[x] += 1
else:
d[x] = 1
return d
Existem maneiras mais concisas de escrever essa função?
Se tivéssemos compreensão de dicionário em Python, poderíamos escrever:
>>> { x: L.count(x) for x in set(L) }
mas como o Python 2.6 não os possui, precisamos escrever:
>>> dict([(x, L.count(x)) for x in set(L)])
Embora essa abordagem possa ser legível, ela não é eficiente: L é percorrido várias vezes. Além disso, isso não funcionará para geradores de vida única; a função deve funcionar igualmente bem para geradores de iteradores, como:
def gen(L):
for x in L:
yield x
Podemos tentar usar oreduce
função (R.I.P.):
>>> reduce(lambda d,x: dict(d, x=d.get(x,0)+1), L, {}) # wrong!
Ops, isso não funciona: o nome da chave é'x'
, nãox
. :(
Eu terminei com:
>>> reduce(lambda d,x: dict(d.items() + [(x, d.get(x, 0)+1)]), L, {})
(No Python 3, teríamos que escreverlist(d.items())
ao invés ded.items()
, mas é hipotético, pois não háreduce
lá.)
Por favor, me derrote com uma linha melhor e mais legível! ;)