Функции для создания и изменения больших данных в R с использованием пакета FF
Я новичок в R и пакете FF и пытаюсь лучше понять, как FF позволяет пользователям работать с большими наборами данных (> 4 Гб). Я потратил значительное количество времени на просмотр учебников в Интернете, но те, которые я смог найти, обычно идут мне на ум.
Я учусь лучше всего, выполняя, поэтому в качестве упражнения я хотел бы знать, как создать набор данных временного ряда в длинном формате, подобный встроенному набору данных "Indometh" R, используя произвольные значения. Тогда я хотел бы преобразовать его в широкий формат. Затем я хотел бы сохранить вывод в виде файла CSV.
С небольшими наборами данных это просто и может быть достигнуто с помощью следующего сценария:
##########################################
#Generate the data frame
DF<-data.frame()
for(Subject in 1:6){
for(time in 1:11){
DF<-rbind(DF,c(Subject,time,runif(1)))
}
}
names(DF)<-c("Subject","time","conc")
##########################################
#Reshape to wide format
DF<-reshape(DF, v.names = "conc", idvar = "Subject", timevar = "time", direction = "wide")
##########################################
#Save csv file
write.csv(DF,file="DF.csv")
Но я хотел бы научиться делать это для файлов размером примерно 10 Гб. Как бы я сделал это с помощью пакета FF? Заранее спасибо.