So stellen Sie fest, ob das Objekt ein gültiges Schlüssel-Wert-Paar in PySpark ist

Wie verstehe ich, dass die Daten im Format "Schlüssel: Wert" vorliegen, wenn ich eine Festplatte besitze? Gibt es eine Möglichkeit, das Gleiche zu finden? So etwas wie type (object) gibt Auskunft über den Typ eines Objekts. Ich habe es versuchtprint type(rdd.take(1)), aber es sagt nur<type 'list'>. Angenommen, ich habe Daten wie(x,1),(x,2),(y,1),(y,3) und ich benutzegroupByKey und bekam(x,(1,2)),(y,(1,3)). Gibt es eine Möglichkeit, @ zu definiere(1,2) und(1,3) als Werte, bei denen x und y Schlüssel sind? Oder muss ein Schlüssel ein einzelner Wert sein? Ich habe festgestellt, dass, wenn ich @ benutreduceByKey undsum Funktion zum Abrufen der Daten((x,3),(y,4)) dann wird es viel einfacher, diese Daten als Schlüssel-Wert-Paar zu definieren

Antworten auf die Frage(2)

Ihre Antwort auf die Frage