R: strptime () и is.na () неожиданные результаты
У меня есть фрейм данных с примерно 8 миллионами строк и 3 столбцами. я использовалstrptime()
следующим образом:
df$date.time <- strptime(df$date.time, "%m/%d/%y %I:%M:%S %p")
Это прекрасно работает для всех, кроме 1104 строк, которые я проверил, используя
df[is.na(df$date.time), ]
Когда я смотрю на эти «проблемные» данные,date.time
Записи, кажется, отформатированы так, как я ожидал. Например, вот наблюдение, которое возникает как проблема, но не является NA:
id date.time outcome
observation543490 2012-03-11 02:14:01 C
Что здесь может происходитьis.na(df$date.time)
возвращает значение TRUE для этой строки, которая, по-видимому, была правильно преобразована?
Вот воспроизводимый пример (если вы находитесь в CST):
is.na(strptime("03/11/12 2:14:01 AM", "%m/%d/%y %I:%M:%S %p", "CST6CDT"))
#[1] TRUE