Spark MLib Decision Trees: ¿Probabilidad de etiquetas por características?
Podría lograr mostrar las probabilidades totales de milabels
, por ejemplo, después de mostrar mi árbol de decisión, tengo una tabla:
Total Predictions :
65% impressions
30% clicks
5% conversions
Pero mi problema es encontrar probabilidades (o contar) porfeatures
(por nodo), por ejemplo:
if feature1 > 5
if feature2 < 10
Predict Impressions
samples : 30 Impressions
else feature2 >= 10
Predict Clicks
samples : 5 Clicks
Scikit
lo hace automáticamente, estoy tratando de encontrar una manera de hacerlo conSpark