Como hash PySpark DataFrame para obter um float retornado?

Question

Jul 03, 2016, 05:06 PM

Como hash PySpark DataFrame para obter um float retornado?

Digamos que eu possua spark frame de dados

+--------+-----+
|  letter|count|
+--------+-----+
|       a|    2|
|       b|    2|
|       c|    1|
+--------+-----+

Então eu queria encontrar maldade. Então eu fiz

df = df.groupBy().mean('letter')

que fornecem um quadro de dados

+------------------+
|       avg(letter)|
+------------------+
|1.6666666666666667|
+------------------+

como posso fazer o hash para obter somente o valor 1,666666666666666667 como df ["avg (letter)"] [0] no dataframe do Pandas? Ou qualquer solução alternativa para obter 1,666666666666666667

Nota: Preciso de um float retornado. Não é uma lista nem dataframe.

Obrigado

questionAnswers(1)

Perguntas populares

0 a resposta

Expressão regular simples para um decimal com uma precisão de 2

0 a resposta

Como usar variáveis de shell na chamada de comando perl em um script de shell bash?

0 a resposta

Removendo / Ocultando / Desativando cabeçalhos de resposta HTTP excessivos no Azure / IIS7 sem o UrlScan

0 a resposta

Diretrizes da interface do usuário da direita para a esquerda?

0 a resposta

Uso de UIApplicationBackgroundRefreshStatusDidChangeNotification sem o método de delegação correspondente

Você é muito ativo! É ótimo!

Como hash PySpark DataFrame para obter um float retornado?

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares