Resultados da pesquisa a pedido "dataframe"
O uso de read_excel com conversores para a leitura de arquivos do Excel no Pandas DataFrame resulta em uma coluna numérica do tipo de objeto
Estou lendo este arquivo do ExcelIndicadores de Energia das Nações Unidas [http://unstats.un.org/unsd/environment/excel_file_tables/2013/Energy%20Indicators.xls] usando o snippet de código aqui: def convert_energy(energy): if isinstance(energy, ...
Por que obtenho um AttributeError ao usar pandas aplicáveis?
Como devo converter o valor NaN em valor categórico com base na condição. Estou recebendo erro ao tentar converter o valor Nan. category gender sub-category title health&beauty NaN makeup lipbalm health&beauty women makeup lipstick NaN NaN NaN ...
Spark Dataframe: Como adicionar um índice Coluna: Aka Distributed Data Index
Eu li dados de um arquivo csv, mas não tenho índice. Quero adicionar uma coluna de 1 ao número da linha. O que devo fazer, obrigado (scala)
criar um dataframe spark a partir de um arquivo json aninhado no scala [duplicado]
Esta pergunta já tem uma resposta aqui: Como acessar subentidades no arquivo JSON? [/questions/44814926/how-to-access-sub-entities-in-json-file] 1 respostaEu tenho um arquivo json que se parece com isso { "group" : {}, "lang" : [ [ 1, "scala", ...
Adicionar coluna extra como a diferença de tempo cumulativa
Como adicionar uma coluna extra com o valor acumulado das diferenças horárias de cada curso? Por exemplo, a tabela inicial é: id_A course weight ts_A value id1 cotton 3.5 2017-04-27 01:35:30 150.000000 id1 cotton 3.5 2017-04-27 01:36:00 ...
Pandas: como designar a linha inicial para extrair dados
Eu estou usando a biblioteca Pandas e Python. Eu tenho um arquivo do Excel que contém algumas informações de cabeçalho na parte superior de uma planilha do Excel que não são necessárias para extração de dados. Porém, as informações do cabeçalho ...
encontre nomes de colunas numéricas no Pandas
Preciso selecionar colunas no Pandas que contêm apenas valores numéricos nos nomes das colunas, por exemplo: df= 0 1 2 3 4 window_label next_states ids 0 17.0 18.0 16.0 15.0 15.0 ddddd d 13.0 1 18.0 16.0 15.0 15.0 16.0 ddddd d 13.0 2 16.0 15.0 ...
Remover linha com valor nulo do quadro de dados do pandas
Estou tentando remover uma linha do meu quadro de dados em que uma das colunas tem um valor nulo. A maior parte da ajuda que posso encontrar está relacionada à remoção de valores de NaN que não funcionaram para mim até agora. Aqui eu criei o ...
Como o método groupby dos pandas está realmente funcionando?
Então, eu estava tentando entender a função pandas.dataFrame.groupby () e me deparei com este exemplo na documentação: In [1]: df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', ...: 'foo', 'bar', 'foo', 'foo'], ...: 'B' : ['one', 'one', ...
junção / mesclagem interna no dataframe do pandas fornece mais linhas que o dataframe esquerdo
Aqui está como são as colunas dos quadros de dados. df1 = 'número do dispositivo', 'data', .... << 10 outras colunas >> 3500 registros df2 = 'número do dispositivo', 'data', .... << 9 outras colunas >> 14.000 registros Em cada quadro de dados, ...