pandy, python - jak wybrać konkretne czasy w timeseries
Pracowałem już od dłuższego czasu przy użyciu Pythona i Pandy do analizy zbioru danych godzinowych i uważam go za całkiem niezły (Pochodzący z Matlab.)
Teraz utknąłem. Stworzyłem mójDataFrame
tak:
<code>SamplingRateMinutes=60 index = DateRange(initialTime,finalTime, offset=datetools.Minute(SamplingRateMinutes)) ts=DataFrame(data, index=index) </code>
Chcę teraz wybrać Dane dla wszystkich dni w godzinach od 10 do 13 i 20-23, aby wykorzystać dane do dalszych obliczeń. Do tej pory wycinałem dane za pomocą
<code> selectedData=ts[begin:end] </code>
Jestem pewien, że dostanę trochę brudnej pętli, aby wybrać potrzebne dane. Ale musi być bardziej elegancki sposób na dokładne indeksowanie tego, co chcę. Jestem pewien, że jest to powszechny problem i rozwiązanie w pseudokodzie powinno wyglądać mniej więcej tak:
<code>myIndex=ts.index[10<=ts.index.hour<=13 or 20<=ts.index.hour<=23] selectedData=ts[myIndex] </code>
Wspomnieć, że jestem inżynierem i nie jestem programistą :) ... jeszcze