Resultados da pesquisa a pedido "pandas"
Pandas - Dataframe grande em fatias em pedaços
Eu tenho um grande dataframe (> 3MM linhas) que estou tentando passar por uma função (a abaixo é bastante simplificada) e continuo recebendo umMemory Error mensagem. Eu acho que estou passando um quadro de dados muito grande para a função, ...
Plotar um histograma usando o índice como rótulos do eixo x
Eu tenho o seguinte quadro de dados em python Sex Survived 0 female 0.742038 1 male 0.188908eu gostaria de plotar um histograma, onde masculino e feminino são os dois valores no eixo xe o eixo y tem seus valores correspondentes. Alguma idéia de ...
A maneira mais rápida de criar listas estritamente crescentes em Python
Gostaria de descobrir qual é a maneira mais eficiente de obter o seguinte em Python: Suponha que tenhamos duas listasa eb que têm o mesmo comprimento e contêm até 1e7 elementos. No entanto, para facilitar a ilustração, podemos considerar ...
Gerar um dataframe de pandas a partir de orderdict?
Estou tentando criar um dataframe de pandas a partir de um decreto de ordem para preservar a ordem dos valores. Mas, por algum motivo, após a criação do quadro de dados, os campos são alterados novamente. Aqui está a lista de ...
Acessando dinamicamente uma coluna de dataframe do pandas
Considere este exemplo simples import pandas as pd df = pd.DataFrame({'one' : [1,2,3], 'two' : [1,0,0]}) df Out[9]: one two 0 1 1 1 2 0 2 3 0Eu quero escrever uma função que tome como entrada um quadro de dadosdf e uma colunamycol. Agora isso ...
Filtrando dinamicamente um dataframe de pandas
Estou tentando filtrar um quadro de dados do pandas usando limites para três colunas import pandas as pd df = pd.DataFrame({"A" : [6, 2, 10, -5, 3], "B" : [2, 5, 3, 2, 6], "C" : [-5, 2, 1, 8, 2]}) df = df.loc[(df.A > 0) & (df.B > 2) & (df.C ...
Criando uma nova coluna, dependendo da igualdade de duas outras colunas
Eu quero comparar os valores de duas colunas onde eu crio uma nova colunabin_crnn. Eu quero 1 se eles são iguais ou 0 se não. # coding: utf-8 import pandas as pd df = pd.read_csv('file.csv',sep=',') if df['crnn_pred']==df['manual_raw_value']: ...
Pandas groupby com junção delimitadora
Tentei usar groupby para agrupar linhas com vários valores. col val A Cat A Tiger B Ball B Bat import pandas as pd df = pd.read_csv("Inputfile.txt", sep='\t') group = df.groupby(['col'])['val'].sum() Eu tenho A CatTiger B BallBatQuero ...
Por que o df.apply (tupla) funciona, mas não o df.apply (lista)?
Aqui está um quadro de dados: A B C 0 6 2 -5 1 2 5 2 2 10 3 1 3 -5 2 8 4 3 6 2Eu poderia recuperar uma coluna que é basicamente uma tupla de colunas do originaldf usandodf.apply: out = df.apply(tuple, 1) print(out) 0 (6, 2, -5) 1 (2, 5, 2) 2 ...
Selecionando todos os nomes de colunas onde o valor é maior que outra coluna nos pandas
Estou tentando encontrar os nomes das colunas de cada coluna em um dataframe de pandas, onde o valor é maior que o de outra coluna. Por exemplo, se eu tiver o seguinte quadro de dados: A B C D threshold 0 1 3 3 1 2 1 2 3 6 1 5 2 9 5 0 2 4Para ...