Язык R: проблемы с вычислением «group by» или разделением с помощью пакета
Я почти новичок в R, поэтому извините, если я задам некоторые основные вопросы, но я не могу найти решение этой проблемы "просто" проблема: имея базу данных (большая, 25 миллионов строк, 14 столбцов) пациентов, у меня есть несколько строк для каждого »Я бы"с, например, такой структурой:
"id" "birth_date" "treatment" "date_treatment"
123 2002-01-01 2 2011-01-03
123 2002-01-01 3 2011-10-03
124 2002-01-01 6 2009-11-07
124 2002-01-01 NA NA
... ..... ...... ........
1022 2007-01-01 4 2011-01-06
Я должен использовать пакет ff, чтобы иметь возможность работать с небольшим количеством оперативной памяти, поэтому ВСЕ процессы должны быть в функции ff. И я хочу знать, для каждого "Я бы"что является минимумомвозраст" когда он / она получил лечение = 2 или 4, так что это будет вкаждый идентификаторв общем коде:
if (обработка в c (2,4)) тогда min (date_treatment - birth_date)
Я только хочу сохранить эти минимумывозраст» данные и, возможно, идентификаторы.
Одним из решений является сделать:
age_c