pandas, python - como selecionar horários específicos em timeseries
Eu trabalhei agora por algum tempo usando python e pandas para analisar um conjunto de dados por hora e encontrá-lo muito bom (Coming from Matlab.)
Agora estou meio preso. Eu criei meuDataFrame
Curtiu isso:
<code>SamplingRateMinutes=60 index = DateRange(initialTime,finalTime, offset=datetools.Minute(SamplingRateMinutes)) ts=DataFrame(data, index=index) </code>
O que eu quero fazer agora é selecionar os dados para todos os dias nas horas 10 a 13 e 20-23 para usar os dados para cálculos adicionais. Até agora eu fatiei os dados usando
<code> selectedData=ts[begin:end] </code>
E tenho certeza de obter algum tipo de looping sujo para selecionar os dados necessários. Mas deve haver uma maneira mais elegante de indexar exatamente o que eu quero. Tenho certeza de que esse é um problema comum e a solução no pseudocódigo deve ser algo assim:
<code>myIndex=ts.index[10<=ts.index.hour<=13 or 20<=ts.index.hour<=23] selectedData=ts[myIndex] </code>
Para mencionar que sou engenheiro e não sou programador :) ... ainda