So teilen Sie Vector in Spalten auf - mit PySpark
Kontext Ich habe einDataFrame
mit 2 Spalten: Wort und Vektor. Wo der Spaltentyp von "Vektor" istVectorUDT
.
Ein Beispiel
word | vector
assert | [435,323,324,212...]
,
Und ich möchte Folgendes erhalten:
word | v1 | v2 | v3 | v4 | v5 | v6 ......
assert | 435 | 5435| 698| 356|....
Frage
Wie kann ich mit PySpark eine Spalte mit Vektoren in mehrere Spalten für jede Dimension aufteilen?
Danke im Vorau