R: strptime () i is.na () nieoczekiwane wyniki
Mam ramkę danych z około 8 milionami wierszy i 3 kolumnami. użyłemstrptime()
W następujący sposób:
df$date.time <- strptime(df$date.time, "%m/%d/%y %I:%M:%S %p")
Działa to dobrze dla wszystkich oprócz 1104 wierszy, które sprawdziłem za pomocą
df[is.na(df$date.time), ]
Kiedy patrzę na te dane „problemowe”,date.time
wpisy wydają się być sformatowane tak, jak powinienem. Na przykład, oto obserwacja, która pojawia się jako problem, ale nie wydaje się być NA:
id date.time outcome
observation543490 2012-03-11 02:14:01 C
Co tu może się działois.na(df$date.time)
zwraca wartość TRUE dla tego wiersza, który najwyraźniej został poprawnie przekonwertowany?
Oto powtarzalny przykład (jeśli jesteś w CST):
is.na(strptime("03/11/12 2:14:01 AM", "%m/%d/%y %I:%M:%S %p", "CST6CDT"))
#[1] TRUE