histograma de pitón de una sola línea
Hay muchas formas de escribir un programa Python que calcule un histograma.
Por histograma, me refiero a una función que cuenta la ocurrencia de objetos en uniterable
y genera los recuentos en un diccionario. Por ejemplo:
>>> L = 'abracadabra'
>>> histogram(L)
{'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2}
Una forma de escribir esta función es:
def histogram(L):
d = {}
for x in L:
if x in d:
d[x] += 1
else:
d[x] = 1
return d
¿Hay formas más concisas de escribir esta función?
Si tuviéramos la comprensión del diccionario en Python, podríamos escribir:
>>> { x: L.count(x) for x in set(L) }
pero como Python 2.6 no los tiene, tenemos que escribir:
>>> dict([(x, L.count(x)) for x in set(L)])
Aunque este enfoque puede ser legible, no es eficiente: L se recorre varias veces. Además, esto no funcionará para generadores de una sola vida; la función debería funcionar igualmente bien para generadores iteradores como:
def gen(L):
for x in L:
yield x
Podríamos intentar usar elreduce
función (R.I.P.):
>>> reduce(lambda d,x: dict(d, x=d.get(x,0)+1), L, {}) # wrong!
Vaya, esto no funciona: el nombre de la clave es'x'
nox
. :(
Terminé con:
>>> reduce(lambda d,x: dict(d.items() + [(x, d.get(x, 0)+1)]), L, {})
(En Python 3, tendríamos que escribirlist(d.items())
en lugar ded.items()
, pero es hipotético, ya que no hayreduce
ahí.)
¡Por favor, golpéame con una frase mejor y más legible! ;)