Bootstrap duży zestaw danych
Chciałbym uruchomić duży zestaw danych, który zawiera wiele zmiennych kolumn i wierszy. Poniżej przedstawiono uproszczone ponowne tworzenie mojego zestawu danych:
charDataDiff <- data.frame(c('A','B','C'), matrix(1:72, nrow=9))
colnames(charDataDiff) <- c("patchId","s380","s390","s400","s410","s420","s430","s440","s450")
Oddziel dane za pomocąpatchId
jako kryteria. Tworzy to trzy listy: po jednej dla każdej zmiennej
idColor <- c("A", "B", "C")
(patchSpectrum <- lapply(idColor, function(idColor) charDataDiff[charDataDiff$patchId==idColor,]))
Utworzono funkcjęsampleBoot
próbkowaćpatchSpectrum
sampleBoot <- function(nbootstrap=2, patch=3){
return(lapply(1:nbootstrap, function(i)
{patchSpectrum[[patch]][sample(1:nrow(patchSpectrum[[patch]]),replace=TRUE),]}))}
Przykład:
sampleBoot(5,3)
Tutaj utknąłem:
Muszę spróbować każdegopatchId
lista wraz z każdą zmienną kolumny (którą łatwo można wykonać za pomocą powyższego „sampleBoot”),Weź medianę każdegopatchId
iteracja listy próbkowania iUtwórz nową populację median, aby obliczyć parametry parametryczne. Mogę to zrobić ręcznie, ale byłoby to głupie.