sparkR 1.6: Vorhersage der Wahrscheinlichkeit bei der Modellierung mit glm (Binomialfamilie)

Ich habe gerade sparkR 1.6.1 auf CentOS installiert und verwende Hadoop nicht. Mein Code zum Modellieren von Daten mit diskreten 'TARGET'-Werten lautet wie folgt:

# 'tr' is a R data frame with 104 numeric columns and one TARGET column
#    TARGET column is either 0 or 1
# Convert 'tr' to spark data frame

train <- createDataFrame(sqlContext, tr)

# test is an R dataframe without TARGET column
# Convert 'test' to spark Data frame
te<-createDataFrame(sqlContext,test)
# Using sparkR's glm model to model data
model <- glm(TARGET ~ . , data = train, family = "binomial")
# Make predictions
predictions <- predict(model, newData = te )

Ich kann Erfolg oder Misserfolg wie folgt bewerten (ich hoffe, ich habe recht):

modelPrediction <- select(predictions, "prediction")
head(modelPrediction)

  prediction
1          0
2          0
3          0
4          0
5          0
6          0

Aber wenn ich die Wahrscheinlichkeit auswerten möchte, erhalte ich folgendes Ergebnis:

modelPrediction <- select(predictions, "probability")
head(modelPrediction)

                probability
1 <environment: 0x6188e1c0>
2 <environment: 0x61894b88>
3 <environment: 0x6189a620>
4 <environment: 0x618a00b8>
5 <environment: 0x618a5b50>
6 <environment: 0x618ac550>

Bitte helfen Sie mir, Wahrscheinlichkeitswerte von Testereignissen zu erhalten. Vielen Dank

Antworten auf die Frage(2)

Ihre Antwort auf die Frage