Resultados da pesquisa a pedido "dataframe"
Crie o Spark DataFrame. Não é possível inferir o esquema para o tipo: <type 'float'>
Alguém poderia me ajudar a resolver esse problema que tenho com o Spark DataFrame? Quando eu façomyFloatRDD.toDF() Eu recebo um erro: TypeError: Não é possível inferir o esquema para o tipo: type 'float' Não entendo o porquê ...
Crie um quadro de dados vazio com nomes de colunas atribuindo um vetor de sequência? [duplicado]
Esta pergunta já tem uma resposta aqui: Crie um data.frame vazio [/questions/10689055/create-an-empty-data-frame] 15 respostas1. crie um quadro de dados vazio y <- data.frame()2. atribua x, um vetor de string, a y como seus nomes de coluna x ...
Como usar funções de janela no PySpark usando DataFrames?
Tentando descobrir como usar as funções da janela no PySpark. Aqui está um exemplo do que eu gostaria de fazer, basta contar o número de vezes que um usuário tem um "evento" (nesse caso, "dt" é um carimbo de data / hora simulado). from ...
Como adicionar uma coluna constante em um Spark DataFrame?
Eu quero adicionar uma coluna em umDataFrame com algum valor arbitrário (que é o mesmo para cada linha). Eu recebo um erro quando usowithColumn do seguinte modo: dt.withColumn('new_column', ...
Use data.table para contar e agregar / resumir uma coluna
Quero contar e agregar (soma) uma coluna em umdata.table, e não conseguiu encontrar a maneira mais eficiente de fazer isso. Isso parece estar perto do que eu queroR resumindo várias colunas com ...
Data.frames em R: preenchimento automático de nome?
Desculpe se isso é trivial. Estou vendo o seguinte comportamento em R: > myDF <- data.frame(Score=5, scoreScaled=1) > myDF$score ## forgot that the Score variable was capitalized [1] 1Resultado esperado: retorna NULL (melhor ainda: gera ...
Dataframe do Pandas - executando soma com redefinição
Quero calcular a soma em execução em uma determinada coluna (sem usar loops, é claro). A ressalva é que eu tenho essa outra coluna que especifica quando redefinir a soma em execução para o valor presente nessa linha. Melhor explicado pelo exemplo ...
Como compactar dois (ou mais) DataFrame no Spark
Eu tenho doisDataFrame a eb. a é como Column 1 | Column 2 abc | 123 cde | 23b é como Column 1 1 2Eu quero fechara eb (ou mais) DataFrames que se torna algo como: Column 1 | Column 2 | Column 3 abc | 123 | 1 cde | 23 | 2Como eu posso fazer isso?
Classifique o quadro de dados por duas colunas (com condição) [duplicado]
Esta pergunta já tem uma resposta aqui: Como classificar um quadro de dados por várias colunas? [/questions/1296646/how-to-sort-a-dataframe-by-multiple-columns] 18 respostasEu tenho o seguinte quadro de dados em R: DataTable <- data.frame( Name ...
Pandas dinamizam ou agrupam para colunas geradas dinamicamente
Eu tenho um dataframe com informações de vendas em um supermercado. Cada linha no quadro de dados representa um item, com várias características como colunas. O DataFrame original é mais ou menos assim: In [1]: import pandas as pd my_data = ...