ways, um groupByKey in apache Spark @ zu ersetz

Question

May 24, 2016, 12:52 PM

ways, um groupByKey in apache Spark @ zu ersetz

Ich würde gerne wissen, wie ich @ am besten ersetzen ka groupByKey Operation mit einem anderen.

rundsätzlich möchte ich ein @ erhaltRDD [(int, List [Measure]), meine Situation

// consider measures like RDD of objects
measures.keyBy(_.getId)
        .groupByKey

Meine Idee ist, @ zu verwend reduByKey stattdessen, weil es weniger Mischen verursacht:

measures.keyBy(_.getId)
        .mapValues(List(_))
        .reduceByKey(_++_)

Aber ich denke, es ist sehr ineffizient, weil es mich zwingt, eine Menge unnötiger List-Objekte zu instanziieren.

Kann jemand eine Idee haben, groupByKey zu ersetzen?

Antworten auf die Frage(2)

Top Fragen

0 die antwort

Wie kann die Sitzung zwischen zwei Aufrufen eines Webdienstes in einer C # -Anwendung aufrecht erhalten werden?

0 die antwort

Wie funktioniert die LINQ-Methode "Where"?

0 die antwort

AWS API Gateway Custom Authorizer AuthorizerConfigurationException

0 die antwort

Fehlende Zeilen beim Schreiben von Dateien mit Lock Python

0 die antwort

Spring 4 + Hibernate 5 = org.springframework.orm.jpa.EntityManagerHolder kann nicht in org.springframework.orm.hibernate5.SessionHolder umgewandelt werden

Du bist sehr aktiv! Es ist großartig!

ways, um groupByKey in apache Spark @ zu ersetz

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen