Resultados da pesquisa a pedido "pandas"

1 a resposta

dict objetos convertidos em string quando lidos de csv para dataframe pandas python

Eu tenho um arquivo csv, que tem muitas colunas. Uma coluna contém dados na forma de objetos dict, bem como cadeias. Por exemplo: a coluna contém dados como: {"a": 5, "b": 6, "c": 8}, "usa", "india", {"a": 9, "b": 10 ", c ": 11} Quando li este ...

3 a resposta

descarte linhas de objetos não json da coluna python dataframe

Eu tenho um quadro de dados de modo que a coluna contenha objetos json e seqüências de caracteres. Eu quero me livrar de linhas que não contêm objetos json. Abaixo está a aparência do meu dataframe: import pandas as pd df = ...

1 a resposta

Solução escalável para str.contains com lista de strings em pandas

Estou analisando um dataframe de pandasdf1 contendo linhas de objetos de sequência. Eu tenho uma lista de referência de palavras-chave e preciso excluir todas as linhas dedf1 contendo qualquer palavra da lista de referência. Atualmente, eu faço ...

2 a resposta

Convertendo a coluna pandas de sequências separadas por vírgula em variáveis dummy

No meu dataframe, tenho uma variável categórica que gostaria de converter em variáveis dummy. Esta coluna, no entanto, possui vários valores separados por vírgulas: 0 'a' 1 'a,b,c' 2 'a,b,d' 3 'd' 4 'c,d'Por fim, eu gostaria de ter ...

4 a resposta

Encontre contagens de valor em um dataframe de pandas de strings

Quero obter a contagem de frequências de strings dentro de uma coluna. Por um lado, isso é semelhante ao recolhimento de um quadro de dados em um conjunto de linhas que reflete apenas as seqüências de caracteres na coluna. Consegui resolver isso ...

2 a resposta

Converta o quadro de dados de seqüências separadas por vírgula em um código quente

Eu tenho um grande quadro de dados ('dados') formado por uma coluna. Cada linha da coluna é composta por uma sequência e cada sequência é composta por categorias separadas por vírgula. Gostaria de um quente codificar esses dados. Por ...

4 a resposta

Todas as combinações possíveis de colunas no dataframe -pandas / python

Estou tentando pegar um dataframe e criar outro, com todas as combinações possíveis das colunas e a diferença entre os valores correspondentes, ou seja, na coluna de 11 de abril, AB deve ser (B-A) = 0 etc. por exemplo, começando com Dt A B C D ...

2 a resposta

Como soltar uma coluna específica do arquivo csv enquanto o lê usando pandas?

Preciso remover umcolunacom etiquetanomeno momento do carregamento de um CSV usandopandas. Estou lendo csv da seguinte maneira e quero adicionar parâmetros dentro dele para fazer isso. Obrigado. pd.read_csv("sample.csv") Eu sei que isso é feito ...

2 a resposta

Tentativa de encontrar os 5 maiores valores por mês usando groupby

Estou tentando mostrar os três principais valores denc_type para cada mês. Eu tentei usarn_largest mas isso não acontece por data. Dados originais: area nc_type occurred_date 0 Filling x 12/23/2015 0:00 1 Filling f 12/22/2015 0:00 2 Filling s ...

1 a resposta

Como usar o matplotlib para plotar resultados do pyspark sql

Eu sou novo no pyspark. Quero plotar o resultado usando matplotlib, mas não tenho certeza de qual função usar. Procurei uma maneira de converter o resultado do sql em pandas e depois usar o plot.