Loop R para Nomes de Variáveis para executar o modelo de regressão linear
Primeiro, eu sou muito novo nisso, então meu método / pensamento pode estar errado; importei um conjunto de dados xlsx para um quadro de dados usando o R and R studio. Quero poder percorrer os nomes das colunas para obter todas as variáveis exatamente "10"neles para executar uma regressão linear simples. Então, aqui está o meu código:
indx <- grepl('_10_', colnames(data)) #list returns all of the true values in the data set
col10 <- names(data[indx]) #this gives me the names of the columns I want
Aqui está o loop for que tenho, que retorna um erro:
temp <- c()
for(i in 1:length(col10)){
temp = col10[[i]]
lm.test <- lm(Total_Transactions ~ temp[[i]], data = data)
print(temp) #actually prints out the right column names
i + 1
}
É possível executar um loop para colocar essas variáveis no modelo de regressão linear? O erro que estou recebendo é: "Erro no model.frame.default (formula = Total_Transactions ~ temp [[i]],: os comprimentos das variáveis diferem (encontrado para 'temp [[i]]' '"). Se alguém puder me indicar na direção certa eu ficaria muito grato.Obrigado.