Resultados da pesquisa a pedido "pandas"
dict objetos convertidos em string quando lidos de csv para dataframe pandas python
Eu tenho um arquivo csv, que tem muitas colunas. Uma coluna contém dados na forma de objetos dict, bem como cadeias. Por exemplo: a coluna contém dados como: {"a": 5, "b": 6, "c": 8}, "usa", "india", {"a": 9, "b": 10 ", c ": 11} Quando li este ...
descarte linhas de objetos não json da coluna python dataframe
Eu tenho um quadro de dados de modo que a coluna contenha objetos json e seqüências de caracteres. Eu quero me livrar de linhas que não contêm objetos json. Abaixo está a aparência do meu dataframe: import pandas as pd df = ...
Solução escalável para str.contains com lista de strings em pandas
Estou analisando um dataframe de pandasdf1 contendo linhas de objetos de sequência. Eu tenho uma lista de referência de palavras-chave e preciso excluir todas as linhas dedf1 contendo qualquer palavra da lista de referência. Atualmente, eu faço ...
Convertendo a coluna pandas de sequências separadas por vírgula em variáveis dummy
No meu dataframe, tenho uma variável categórica que gostaria de converter em variáveis dummy. Esta coluna, no entanto, possui vários valores separados por vírgulas: 0 'a' 1 'a,b,c' 2 'a,b,d' 3 'd' 4 'c,d'Por fim, eu gostaria de ter ...
Encontre contagens de valor em um dataframe de pandas de strings
Quero obter a contagem de frequências de strings dentro de uma coluna. Por um lado, isso é semelhante ao recolhimento de um quadro de dados em um conjunto de linhas que reflete apenas as seqüências de caracteres na coluna. Consegui resolver isso ...
Converta o quadro de dados de seqüências separadas por vírgula em um código quente
Eu tenho um grande quadro de dados ('dados') formado por uma coluna. Cada linha da coluna é composta por uma sequência e cada sequência é composta por categorias separadas por vírgula. Gostaria de um quente codificar esses dados. Por ...
Todas as combinações possíveis de colunas no dataframe -pandas / python
Estou tentando pegar um dataframe e criar outro, com todas as combinações possíveis das colunas e a diferença entre os valores correspondentes, ou seja, na coluna de 11 de abril, AB deve ser (B-A) = 0 etc. por exemplo, começando com Dt A B C D ...
Como soltar uma coluna específica do arquivo csv enquanto o lê usando pandas?
Preciso remover umcolunacom etiquetanomeno momento do carregamento de um CSV usandopandas. Estou lendo csv da seguinte maneira e quero adicionar parâmetros dentro dele para fazer isso. Obrigado. pd.read_csv("sample.csv") Eu sei que isso é feito ...
Tentativa de encontrar os 5 maiores valores por mês usando groupby
Estou tentando mostrar os três principais valores denc_type para cada mês. Eu tentei usarn_largest mas isso não acontece por data. Dados originais: area nc_type occurred_date 0 Filling x 12/23/2015 0:00 1 Filling f 12/22/2015 0:00 2 Filling s ...
Como usar o matplotlib para plotar resultados do pyspark sql
Eu sou novo no pyspark. Quero plotar o resultado usando matplotlib, mas não tenho certeza de qual função usar. Procurei uma maneira de converter o resultado do sql em pandas e depois usar o plot.