Encontrando clusters de números em uma lista
Estou lutando com isso, já que tenho certeza de que uma dúzia de loops for-loops não é a solução para esse problema:
Há uma lista ordenada de números como
numbers = [123, 124, 128, 160, 167, 213, 215, 230, 245, 255, 257, 400, 401, 402, 430]
e eu quero criar um dict com listas de números, em que a diferença dos números (seguindo um ao outro) não é maior que 15. Então a saída seria esta:
clusters = {
1 : [123, 124, 128],
2 : [160, 167],
3 : [213, 215, 230, 245, 255, 257],
4 : [400, 401, 402],
5 : [430]
}
Minha solução atual é um pouco feia (tenho que remover duplicatas no final ...), tenho certeza de que isso pode ser feito de forma pítotica.
Isso é o que eu faço agora:
clusters = {}
dIndex = 0
for i in range(len(numbers)-1) :
if numbers[i+1] - numbers[i] <= 15 :
if not clusters.has_key(dIndex) : clusters[dIndex] = []
clusters[dIndex].append(numbers[i])
clusters[dIndex].append(numbers[i+1])
else : dIndex += 1