Resultados da pesquisa a pedido "pandas"

4 a resposta

pandas - filtra o dataframe por outro dataframe por elementos de linha

Eu tenho um quadro de dadosdf1 que se parece com: c k l 0 A 1 a 1 A 2 b 2 B 2 a 3 C 2 a 4 C 2 de outro chamadodf2 gostar: c l 0 A b 1 C aEu gostaria de filtrardf1 mantendo apenas os valores que NÃO ESTÃOdf2. Espera-se que os valores para ...

1 a resposta

classificação numérica uma coluna contendo números e seqüências de caracteres (pandas / python)

Eu tenho que classificar um quadro de dados nas colunas 1 e 2; a coluna 1 contém números e texto, que devem ser classificados numericamente. No Excel, essa é a maneira padrão de classificar, mas não nos pandas. Não consegui encontrar ...

1 a resposta

Média da contagem diária de registros por mês em um DataFrame do Pandas

Eu tenho um DataFrame de pandas com umTIMESTAMP coluna, que é do tipo de dados datetime64. Lembre-se de que, inicialmente, esta coluna não está definida como o índice; o índice é apenas números inteiros regulares e as primeiras linhas ...

2 a resposta

AttributeError: só pode usar o acessador .dt com valores semelhantes a dados

Oi, eu estou usando pandas para converter uma coluna para mês. Quando leio meus dados, eles são objetos: Date object dtype: objectEntão, eu estou primeiro fazendo-os namorar e depois tentar fazê-los como meses: import pandas as pd file = ...

1 a resposta

Como você exclui uma coluna não numérica de um conjunto de dados de entrada?

Por exemplo, se eu quiser considerar uma espécie de flor, número de pétalas, tempo de germinação e usuárioID, o usuárioID vai ter um hífen lá. Portanto, na minha análise de dados, não quero usá-lo. Estou ciente de que posso codificá-lo, mas quero ...

1 a resposta

Como o Spark DataFrame lida com o Pandas DataFrame que é maior que a memória

Estou aprendendo o Spark agora e parece ser a solução de big data para o Pandas Dataframe, mas tenho essa pergunta que me deixa insegura. Atualmente, estou armazenando quadros de dados do Pandas maiores que a memória usando o HDF5. O HDF5 é uma ...

1 a resposta

Quadro de dados do Pandas read_csv em dados incorretos

Eu quero ler em um csv muito grande (não pode ser aberto no Excel e editado facilmente), mas em algum ponto da 100.000ª linha, há uma linha com uma coluna extra, causando a falha do programa. Esta linha está com erro, por isso preciso de uma ...

2 a resposta

pandas groupby com sum () em arquivo csv grande?

Tenho um arquivo grande (19 GB ou mais) que desejo carregar na memória para realizar uma agregação em algumas colunas. o arquivo fica assim: id, col1, col2, col3, 1 , 12 , 15 , 13 2 , 18 , 15 , 13 3 , 14 , 15 , 13 3 , 14 , 185 , 213observe que, ...

1 a resposta

Maior / menor do que as comparações entre os DataFrames / Series do Pandas

Como posso realizar comparações entre DataFrames e Series? Eu gostaria de mascarar elementos em um DataFrame / Series que sejam maiores / menores que os elementos em outro DataFrame / Series. Por exemplo, o seguinte não substitui elementos ...

3 a resposta

erro ao ler o arquivo JSON

Estou tentando ler o arquivo JSON usando pandas. import pandas as pd df = pd.read_json('https://data.gov.in/node/305681/datastore/export/json')Eu recebo valueError. ValueError: arrays must all be same lengthAlgumas outras páginas JSON ...