Differenz zwischen org.apache.spark.ml.classification und org.apache.spark.mllib.classification

Question

May 14, 2015, 09:35 AM

Differenz zwischen org.apache.spark.ml.classification und org.apache.spark.mllib.classification

Ich schreibe eine Spark-Anwendung und möchte Algorithmen in MLlib verwenden. In der API-Dokumentation habe ich zwei verschiedene Klassen für denselben Algorithmus gefunden.

Zum Beispiel gibt es eine LogisticRegression in org.apache.spark.ml.classification und eine LogisticRegression mit SGD in org.apache.spark.mllib.classification.

Der einzige Unterschied, den ich feststellen kann, ist, dass der in org.apache.spark.ml von Estimator geerbt wurde und für die Kreuzvalidierung verwendet werden konnte. Ich war ziemlich verwirrt, dass sie in verschiedenen Paketen platziert sind. Kennt jemand den Grund dafür? Vielen Dank