jak konwertować dane na ramkę do transakcji dla arule
Czytam dane z pliku csv, dane mają 3 kolumny, jedna to identyfikator transakcji, a dwie pozostałe to kategoria produktów i produktów. Muszę to przekonwertować na transakcje, aby korzystać zapriori
funkcja warules. Pokazuje błąd podczas konwersji na transakcje:
dat <- read.csv("spss.csv",head=TRUE,sep="," , as.is = T)
dat[,2] <- factor(dat[,2])
dat[,3] <- factor(dat[,3])
spssdat <- dat[,c(1,2,3)]
str(spssdat)
'data.frame': 108919 obs. of 3 variables:
$ Transaction_id: int 3000312 3000312 3001972 3003361 3003361 3003361 3003361 3003361 3003361 3004637 ...
$ product_catalog : Factor w/ 9 levels "AIM","BA","IM",..: 1 1 5 7 7 7 7 7 7 1 ...
$ product : Factor w/ 332 levels "ACM","ACTG/AIM",..: 7 7 159 61 61 61 61 61 61 7 ...
trans4 <- as(spssdat, "transactions")
Error in as(spssdat, "transactions") :
no method or default for coercing “data.frame” to “transactions”
Jeśli dane mają tylko dwie kolumny, mogą działać:
trans4 <- as(split(spssdat[,2], spssdat[,1]), "transactions")
Ale nie wiem, jak konwertować, gdy mam 3 kolumny. Zazwyczaj są dodatkowe kolumny, takie jak atrybuty kategorii, atrybuty klienta. więc kolumna zwykle jest większa niż 2 kolumny. trzeba znaleźć reguły między wieloma kolumnami.