Resultados da pesquisa a pedido "dataframe"

2 a resposta

O uso de read_excel com conversores para a leitura de arquivos do Excel no Pandas DataFrame resulta em uma coluna numérica do tipo de objeto

Estou lendo este arquivo do ExcelIndicadores de Energia das Nações Unidas [http://unstats.un.org/unsd/environment/excel_file_tables/2013/Energy%20Indicators.xls] usando o snippet de código aqui: def convert_energy(energy): if isinstance(energy, ...

3 a resposta

Por que obtenho um AttributeError ao usar pandas aplicáveis?

Como devo converter o valor NaN em valor categórico com base na condição. Estou recebendo erro ao tentar converter o valor Nan. category gender sub-category title health&beauty NaN makeup lipbalm health&beauty women makeup lipstick NaN NaN NaN ...

4 a resposta

Spark Dataframe: Como adicionar um índice Coluna: Aka Distributed Data Index

Eu li dados de um arquivo csv, mas não tenho índice. Quero adicionar uma coluna de 1 ao número da linha. O que devo fazer, obrigado (scala)

2 a resposta

criar um dataframe spark a partir de um arquivo json aninhado no scala [duplicado]

Esta pergunta já tem uma resposta aqui: Como acessar subentidades no arquivo JSON? [/questions/44814926/how-to-access-sub-entities-in-json-file] 1 respostaEu tenho um arquivo json que se parece com isso { "group" : {}, "lang" : [ [ 1, "scala", ...

3 a resposta

Adicionar coluna extra como a diferença de tempo cumulativa

Como adicionar uma coluna extra com o valor acumulado das diferenças horárias de cada curso? Por exemplo, a tabela inicial é: id_A course weight ts_A value id1 cotton 3.5 2017-04-27 01:35:30 150.000000 id1 cotton 3.5 2017-04-27 01:36:00 ...

2 a resposta

Pandas: como designar a linha inicial para extrair dados

Eu estou usando a biblioteca Pandas e Python. Eu tenho um arquivo do Excel que contém algumas informações de cabeçalho na parte superior de uma planilha do Excel que não são necessárias para extração de dados. Porém, as informações do cabeçalho ...

4 a resposta

encontre nomes de colunas numéricas no Pandas

Preciso selecionar colunas no Pandas que contêm apenas valores numéricos nos nomes das colunas, por exemplo: df= 0 1 2 3 4 window_label next_states ids 0 17.0 18.0 16.0 15.0 15.0 ddddd d 13.0 1 18.0 16.0 15.0 15.0 16.0 ddddd d 13.0 2 16.0 15.0 ...

2 a resposta

Remover linha com valor nulo do quadro de dados do pandas

Estou tentando remover uma linha do meu quadro de dados em que uma das colunas tem um valor nulo. A maior parte da ajuda que posso encontrar está relacionada à remoção de valores de NaN que não funcionaram para mim até agora. Aqui eu criei o ...

1 a resposta

Como o método groupby dos pandas está realmente funcionando?

Então, eu estava tentando entender a função pandas.dataFrame.groupby () e me deparei com este exemplo na documentação: In [1]: df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', ...: 'foo', 'bar', 'foo', 'foo'], ...: 'B' : ['one', 'one', ...

1 a resposta

junção / mesclagem interna no dataframe do pandas fornece mais linhas que o dataframe esquerdo

Aqui está como são as colunas dos quadros de dados. df1 = 'número do dispositivo', 'data', .... << 10 outras colunas >> 3500 registros df2 = 'número do dispositivo', 'data', .... << 9 outras colunas >> 14.000 registros Em cada quadro de dados, ...