Ajustando dados às distribuições?
Não sou um estatístico (mais um desenvolvedor de pesquisa na web), mas tenho ouvido muito sobreescamoso eR nos dias de hoje. Por curiosidade, eu queria fazer essa pergunta (embora possa parecer bobagem para os especialistas por aqui), porque não tenho certeza dos avanços nessa área e quero saber como as pessoas sem uma sólida formação em estatística abordam esses problemas.
Dado um conjunto de números reais observados em um experimento, digamos que eles pertençam a uma das muitas distribuições existentes no mercado (como Weibull, Erlang, Cauchy, Exponencial etc.), existem maneiras automatizadas de encontrar a distribuição e a distribuição corretas parâmetros para os dados? Existem bons tutoriais que me orientam no processo?
Cenário do mundo real: Por exemplo, digamos que iniciei uma pequena pesquisa e gravei informações sobre quantas pessoas uma pessoa fala todos os dias para, digamos, 300 pessoas e eu tenho as seguintes informações:
1 10
2 5
3 20
...
...
onde X Y me diz que a pessoa X conversou com Y durante o período da pesquisa. Agora, usando as informações das 300 pessoas, quero encaixar isso em um modelo. A questão se resume a: existem maneiras automatizadas de descobrir os parâmetros corretos de distribuição e distribuição para esses dados ou, se não, existe um bom procedimento passo a passo para obter o mesmo?