Funktion zum Konvertieren des DataFrame-Spaltentyps
R versteht häufig Datenrahmenspalten in einem "falschen" Format, oder Sie müssen nur die Spaltenklasse von Faktor zu Zeichen ändern, um sie zu ändern. Ich habe die Spaltenklasse zuvor folgendermaßen geändert:
set.seed(1)
df <- data.frame(x = 1:10,
y = rep(1:2, 5),
k = rnorm(10, 5,2),
z = rep(c(2010, 2012, 2011, 2010, 1999), 2),
j = c(rep(c("a", "b", "c"), 3), "d"))
x <- c("y", "z")
for(i in 1:length(x)){
df[,x[i]] <- factor(df[,x[i]])}
Und zurück zu numerisch:
x <- 1:5
for(i in 1:length(x)){
df[,x[i]] <- as.numeric(as.character(df[,x[i]]))} # Character cannot become numeric
Mir ist aufgefallen, dass es vielleicht einen besseren Weg gibt, dies zu tun. ich fanddiese FrageDas ist fast genau das, was ich brauche:
convert.magic <- function(obj,types){
out <- lapply(1:length(obj),FUN = function(i){FUN1 <-
switch(types[i],
character = as.character,
numeric = as.numeric,
factor = as.factor); FUN1(obj[,i])})
names(out) <- colnames(obj)
as.data.frame(out)
}
Für diese Funktion muss jedoch für jede Spalte ein Vektortyp angegeben werden:
convert.magic(df, rep("factor",5))
convert.magic(df, c("character", "factor"))
# Error in FUN(1:5[[1L]], ...) : could not find function "FUN1"
Könnte mir jemand helfen und diese Funktion neu aufbauen, damit sie mit Spaltennamen und -nummern funktioniert? Ich fürchte, das wäre mir zu weit fortgeschritten ...
x <- c("y", "z")
convert.magic(df, "character", x)