Resultados da pesquisa a pedido "pandas"
Pandas Série de listas para uma série
Eu tenho uma série de listas de cordas do Pandas: 0 [slim, waist, man] 1 [slim, waistline] 2 [santa]Como você pode ver, as listas variam de acordo com o comprimento. Eu quero uma maneira eficiente de recolher isso em uma série 0 slim 1 waist 2 ...
delimitador read_csv do pandas python nos dados da coluna
Estou tendo esse tipo de arquivo CSV: 12012;My Name is Mike. What is your's?;3;0 1522;In my opinion: It's cool; or at least not bad;4;0 21427;Hello. I like this feature!;5;1Eu quero colocar esses dados em dapandas.DataFrame. Masread_csv(sep=";") ...
pandas: otimizando meu código (groupby () / apply ())
Eu tenho um quadro de dados de forma (RxC) 1,5M x 128. Eu faço o seguinte: Eu faço groupby () com base em 6 colunas. Isso cria ~ 8700 subgrupos, cada um com a forma 538 x 122.Em cada subgrupo, eu corro apply (). Essa função calcula a% de ...
Pandas: adicione várias colunas vazias ao DataFrame
Esta pode ser uma pergunta estúpida, mas como adiciono várias colunas vazias a um DataFrame a partir de uma lista? Eu posso fazer: df["B"] = None df["C"] = None df["D"] = NoneMas eu não posso fazer: df[["B", "C", "D"]] = None KeyError: "['B' ...
Agrupar por índice + coluna em pandas
Eu tenho um quadro de dados que tem as colunas ID do usuárioitem_boughtAqui user_id é o índice do df. Quero agrupar por user_id e item_bought e obter a contagem sábia de itens para o usuário. Como faço isso. obrigado
Pandas: se a linha da coluna A contiver "x", escreva "y" na linha da coluna B
Parapandas, Estou procurando uma maneira de escrever valores condicionais para cada linha na coluna B, com base em substrings para as linhas correspondentes na coluna A. Então, se a célulaA contém"BULL", Escreva"Long" paraB. Ou se a célula ...
Como resolver o erro de importação de pandas usando o iPython Notebook no Windows?
Estou tentando importar pandas enquanto uso o iPython. Meu objetivo geral é usar o XLwings. Estou no Windows 7 e usei o Anaconda para instalar Python, pandas e todas as dependências. Aqui está o meu código: from pandas import DataFrameQue ...
dataframes de pandas descartam colunas por número de nan
Eu tenho um quadro de dados com algumas colunas contendo nan. Eu gostaria de soltar essas colunas com certo número de nan. Por exemplo, no código a seguir, gostaria de soltar qualquer coluna com 2 ou mais nan. Nesse caso, a coluna 'C' será ...
Python pandas - pd.melt um dataframe com resultados de índice de data e hora no NaN
Eu tenho o seguinte quadro de dados (sim_2005): Date ELEM1 ELEM2 ... ELEM1133 2005-01-01 0.021 2.455 ... 345.2 2005-01-02 0.321 2.331 ... 355.1 ... ... ... ... ... 2005-12-31 0.789 3.456 ... 459.9 [365 rows x 1133 columns]comDate Começar ...
Reindexar um quadro de dados com valores de índice duplicados
Então, importei e mesclei 4 csv's em um dataframe chamado data. No entanto, ao inspecionar o índice do quadro de dados com: index_series = pd.Series(data.index.values) index_series.value_counts()Vejo que várias entradas de índice têm 4 ...