Resultados da pesquisa a pedido "pandas"

5 a resposta

Pandas e AWS Lambda

Alguém tem uma versão totalmente compilada do pandas que seja compatível com o AWS Lambda? Depois de pesquisar por algumas horas, não consigo encontrar o que estou procurando e a documentação sobre esse assunto é inexistente. Preciso acessar o ...

1 a resposta

Adicionando rótulos de valor em um gráfico de barras usando matplotlib

Quando imprimo graph_by_users = users.pivot(index='address', columns='used_at', values='users') eu recebo address used_at time online 0 am.ru 2014 114.741944 1 am.ru 2015 50.945000 2 auto.ru 2014 2533.983889 3 auto.ru 2015 1923.157500 4 ...

2 a resposta

Classificar seqüências de caracteres na coluna e imprimir gráfico

Eu tenho o quadro de dados, mas todas as seqüências de caracteres são duplicadas e quando tento imprimir o gráfico, ele contém a coluna duplicada. Tento excluí-lo, mas meu gráfico é impresso incorretamente. Meu csv ...

2 a resposta

Substituindo valores em um índice múltiplo de pandas

Eu tenho um quadro de dados com um índice múltiplo. Quero alterar o valor do 2º índice quando certas condições no primeiro índice forem atendidas. Encontrei uma pergunta semelhante (mas diferente) aqui:Substituir um valor no ...

1 a resposta

crie uma nova coluna no dataframe usando fuzzywuzzy

Eu tenho um quadro de dados empandas onde eu estou usandofuzzywuzzy pacote em python para combinar a primeira coluna no quadro de dados com a segunda coluna. Eu defini uma função para criar uma saída com a primeira coluna, a segunda coluna e a ...

1 a resposta

Pandas: Selecionando linhas com base nas contagens de valores de uma coluna específica

Qual é a maneira mais simples de selecionar todas as linhas de um quadro de dados do panda, quem é o sym ocorre exatamente duas vezes na tabela inteira? Por exemplo, na tabela abaixo, eu gostaria de selecionar todas as linhas com sym em ['b', ...

4 a resposta

java.lang.OutOfMemoryError no pyspark

Hy, Eu tenho um dataframe em um sparkcontext com 400k linhas e 3 colunas. O driver possui 143.5 de memória de armazenamento 16/03/21 19:52:35 INFO BlockManagerMasterEndpoint: Registering block manager localhost:55613 with 143.5 GB RAM, ...

1 a resposta

pandas filtrando e comparando datas

Eu tenho um arquivo sql que consiste nos dados abaixo dos quais li em pandas. df = pandas.read_sql('Database count details', con=engine, index_col='id', parse_dates='newest_available_date')Resultado id code newest_date_available 9793708 3514 ...

1 a resposta

Acessando total_seconds () na coluna de dados do pandas

Eu quero criar uma nova coluna em um quadro de dados do pandas que é o tempo decorrido desde o início do quadro de dados. Estou importando um arquivo de log para um quadro de dados com informações de data e hora, mas o acesso à ...

1 a resposta

Como substituir valores em uma coluna se outra coluna é um NaN?

Portanto, essa deve ser a coisa mais fácil do mundo. Pseudo-código: Replace column C with NaN if column E is NaNEu sei que posso fazer isso retirando todas as linhas do quadro de dados em que a coluna E é NaN, substituindo toda a coluna C e ...