Resultados da pesquisa a pedido "dataframe"

1 a resposta

Crie o Spark DataFrame. Não é possível inferir o esquema para o tipo: <type 'float'>

Alguém poderia me ajudar a resolver esse problema que tenho com o Spark DataFrame? Quando eu façomyFloatRDD.toDF() Eu recebo um erro: TypeError: Não é possível inferir o esquema para o tipo: type 'float' Não entendo o porquê ...

1 a resposta

Crie um quadro de dados vazio com nomes de colunas atribuindo um vetor de sequência? [duplicado]

Esta pergunta já tem uma resposta aqui: Crie um data.frame vazio [/questions/10689055/create-an-empty-data-frame] 15 respostas1. crie um quadro de dados vazio y <- data.frame()2. atribua x, um vetor de string, a y como seus nomes de coluna x ...

1 a resposta

Como usar funções de janela no PySpark usando DataFrames?

Tentando descobrir como usar as funções da janela no PySpark. Aqui está um exemplo do que eu gostaria de fazer, basta contar o número de vezes que um usuário tem um "evento" (nesse caso, "dt" é um carimbo de data / hora simulado). from ...

3 a resposta

Como adicionar uma coluna constante em um Spark DataFrame?

Eu quero adicionar uma coluna em umDataFrame com algum valor arbitrário (que é o mesmo para cada linha). Eu recebo um erro quando usowithColumn do seguinte modo: dt.withColumn('new_column', ...

1 a resposta

Use data.table para contar e agregar / resumir uma coluna

Quero contar e agregar (soma) uma coluna em umdata.table, e não conseguiu encontrar a maneira mais eficiente de fazer isso. Isso parece estar perto do que eu queroR resumindo várias colunas com ...

1 a resposta

Data.frames em R: preenchimento automático de nome?

Desculpe se isso é trivial. Estou vendo o seguinte comportamento em R: > myDF <- data.frame(Score=5, scoreScaled=1) > myDF$score ## forgot that the Score variable was capitalized [1] 1Resultado esperado: retorna NULL (melhor ainda: gera ...

1 a resposta

Dataframe do Pandas - executando soma com redefinição

Quero calcular a soma em execução em uma determinada coluna (sem usar loops, é claro). A ressalva é que eu tenho essa outra coluna que especifica quando redefinir a soma em execução para o valor presente nessa linha. Melhor explicado pelo exemplo ...

4 a resposta

Como compactar dois (ou mais) DataFrame no Spark

Eu tenho doisDataFrame a eb. a é como Column 1 | Column 2 abc | 123 cde | 23b é como Column 1 1 2Eu quero fechara eb (ou mais) DataFrames que se torna algo como: Column 1 | Column 2 | Column 3 abc | 123 | 1 cde | 23 | 2Como eu posso fazer isso?

2 a resposta

Classifique o quadro de dados por duas colunas (com condição) [duplicado]

Esta pergunta já tem uma resposta aqui: Como classificar um quadro de dados por várias colunas? [/questions/1296646/how-to-sort-a-dataframe-by-multiple-columns] 18 respostasEu tenho o seguinte quadro de dados em R: DataTable <- data.frame( Name ...

1 a resposta

Pandas dinamizam ou agrupam para colunas geradas dinamicamente

Eu tenho um dataframe com informações de vendas em um supermercado. Cada linha no quadro de dados representa um item, com várias características como colunas. O DataFrame original é mais ou menos assim: In [1]: import pandas as pd my_data = ...