Arrancar un gran conjunto de datos
Me gustaría arrancar un conjunto de datos de gran tamaño que contiene múltiples variables de columna y fila. Lo siguiente es una recreación simplificada de mi conjunto de datos:
charDataDiff <- data.frame(c('A','B','C'), matrix(1:72, nrow=9))
colnames(charDataDiff) <- c("patchId","s380","s390","s400","s410","s420","s430","s440","s450")
Separe los datos utilizando elpatchId
según los criterios. Esto crea tres listas: una para cada variable
idColor <- c("A", "B", "C")
(patchSpectrum <- lapply(idColor, function(idColor) charDataDiff[charDataDiff$patchId==idColor,]))
Creó la funciónsampleBoot
para probar elpatchSpectrum
sampleBoot <- function(nbootstrap=2, patch=3){
return(lapply(1:nbootstrap, function(i)
{patchSpectrum[[patch]][sample(1:nrow(patchSpectrum[[patch]]),replace=TRUE),]}))}
Ejemplo:
sampleBoot(5,3)
Aquí es donde estoy atrapado:
Necesito probar cadapatchId
enumerar junto con cada variable de columna (que el "sampleBoot" anterior cumple fácilmente),Toma la mediana de cada unopatchId
iteración de la lista de muestreo, yCrea una nueva población de medianas para calcular parámetros paramétricos. Puedo hacerlo manualmente pero eso sería una tontería.