Как хэшировать PySpark DataFrame, чтобы вернуть значение с плавающей точкой?

Question

Jul 03, 2016, 05:06 PM

Как хэшировать PySpark DataFrame, чтобы вернуть значение с плавающей точкой?

Допустим, у меня есть искра dataframe

+--------+-----+
|  letter|count|
+--------+-----+
|       a|    2|
|       b|    2|
|       c|    1|
+--------+-----+

Тогда я хотел найти скупую. Так я и сделал

df = df.groupBy().mean('letter')

которые дают фрейм данных

+------------------+
|       avg(letter)|
+------------------+
|1.6666666666666667|
+------------------+

Как я могу хэшировать его, чтобы получить только значение 1.6666666666666667 как df ["avg (letter)"] [0] в кадре данных Pandas? Или любой обходной путь, чтобы получить 1.6666666666666667

Примечание: мне нужно вернуть поплавок. Ни список, ни датафрейм.

Спасибо

Как хэшировать PySpark DataFrame, чтобы вернуть значение с плавающей точкой?

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как хэшировать PySpark DataFrame, чтобы вернуть значение с плавающей точкой?

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы