гистограмма питона, одна строка
Есть много способов написать программу на Python, которая вычисляет гистограмму.
Под гистограммой я имею в виду функцию, которая считает возникновение объектов вiterable
и выводит значения в словаре. Например:
>>> L = 'abracadabra'
>>> histogram(L)
{'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2}
Один из способов написать эту функцию:
def histogram(L):
d = {}
for x in L:
if x in d:
d[x] += 1
else:
d[x] = 1
return d
Есть ли более краткие способы написания этой функции?
Если бы у нас было понимание словаря в Python, мы могли бы написать:
>>> { x: L.count(x) for x in set(L) }
но поскольку в Python 2.6 их нет, мы должны написать:
>>> dict([(x, L.count(x)) for x in set(L)])
Хотя этот подход может быть читаемым, он неэффективен: L обходится несколько раз. Кроме того, это не будет работать для генераторов с одиночной жизнью; функция должна одинаково хорошо работать для генераторов итераторов, таких как:
def gen(L):
for x in L:
yield x
Мы могли бы попытаться использоватьreduce
функция (Р.И.П.):
>>> reduce(lambda d,x: dict(d, x=d.get(x,0)+1), L, {}) # wrong!
К сожалению, это не работает: имя ключа'x'
неx
, :(
Я закончил с:
>>> reduce(lambda d,x: dict(d.items() + [(x, d.get(x, 0)+1)]), L, {})
(В Python 3 нам нужно было бы написатьlist(d.items())
вместоd.items()
Гипотетично, поскольку нетreduce
там.)
Пожалуйста, побейте меня лучшей, более читаемой строчкой! ;)