Por que o pandas.to_datetime é lento para o formato de hora fora do padrão, como '2014/12/31'

Question

Aug 16, 2015, 01:42 PM

pandas string-to-datetime python-datetime csv python

Por que o pandas.to_datetime é lento para o formato de hora fora do padrão, como '2014/12/31'

Eu tenho um arquivo .csv nesse formato

timestmp, p
2014/12/31 00:31:01:9200, 0.7
2014/12/31 00:31:12:1700, 1.9
...

e quando lido atravéspd.read_csv e converta o time str em datetime usandopd.to_datetime, o desempenho cai drasticamente. Aqui está um exemplo mínimo.

import re
import pandas as pd

d = '2014-12-12 01:02:03.0030'
c = re.sub('-', '/', d)

%timeit pd.to_datetime(d)
%timeit pd.to_datetime(c)
%timeit pd.to_datetime(c, format="%Y/%m/%d %H:%M:%S.%f")

e as performances são:

10000 loops, best of 3: 62.4 µs per loop
10000 loops, best of 3: 181 µs per loop
10000 loops, best of 3: 82.9 µs per loop

então, como eu poderia melhorar o desempenho depd.to_datetime ao ler a data de um arquivo csv?

questionAnswers(3)

Perguntas populares

0 a resposta

jQuery index () no javascript de baunilha

0 a resposta

C # posição janela na área de trabalho

0 a resposta

Como prolongar marcas de escala específicas no ggplot com grade de faceta?

0 a resposta

Importação de arquivos do Excel para R, xlsx ou xls

0 a resposta

Android: Como fazer o AlertDialog com 2 linhas de texto e RadioButton (escolha única)?

Você é muito ativo! É ótimo!

Por que o pandas.to_datetime é lento para o formato de hora fora do padrão, como &#39;2014/12/31&#39;

questionAnswers(3)

yourAnswerToTheQuestion

Perguntas populares

Por que o pandas.to_datetime é lento para o formato de hora fora do padrão, como '2014/12/31'