Resultados da pesquisa a pedido "dataframe"
Pandas preenchendo datas e valores ausentes no grupo
Eu tenho um quadro de dados que se parece com o seguinte x = pd.DataFrame({'user': ['a','a','b','b'], 'dt': ['2016-01-01','2016-01-02', '2016-01-05','2016-01-06'], 'val': [1,33,2,1]})O que eu gostaria de poder fazer é encontrar a data mínima e ...
Plotagem com pandas e matplotlib
Estou tentando criar um gráfico de dispersão em Python. Eu tenho um dataframe 'df' com uma categoria especificada ex e y são números de coluna: groups = df.groupby(category) fig, ax = plt.subplots() for name, group in groups: ...
Como usar .le () e .ge () ao filtrar colunas do quadro de dados do pandas?
Aqui está um exemplo de panda DataFrame: import pandas as pd import numpy as np data = {"first_column": ["item1", "item2", "item3", "item4", "item5", "item6", "item7"], "second_column": ["cat1", "cat1", "cat1", "cat2", "cat2", "cat2", "cat2"], ...
Expressão pandas DataFrame.query que retorna todas as linhas por padrão
Eu descobri o método pandas DataFrame.query e elequase faz exatamente o que eu precisava (e implementei meu próprio analisador, já que eu não tinha percebido que existia, mas realmente deveria estar usando o método padrão). Gostaria que meus ...
Juntando níveis de fator de duas colunas
Eu tenho 2 colunas de dados com o mesmo tipo de dados (Strings). Eu quero juntar os níveis das colunas. ie temos: col1 col2 Bob John Tom Bob Frank Jane Jim Bob Tom Bob ... ... (and so on)agora col1 tem 4 níveis (Bob, Tom Frank, Jim) e col2 tem ...
Python Dask - concatenação vertical de 2 DataFrames
Eu tenho o seguinte Dask DataFrame em Python: A B C D E F 0 1 4 8 1 3 5 1 6 6 2 2 0 0 2 9 4 5 0 6 35 3 0 1 7 10 9 4 4 0 7 2 6 1 2Estou tentando concatenar 2 Dask DataFrames verticalmente: ddf_i = ddf + 11.5 dd.concat([ddf,ddf_i],axis=0)mas eu ...
Correspondência de valores entre quadros de dados com base em datas sobrepostas
Atualmente, estou lidando com as seguintes estruturas de dados: Atributos df: ID Begin_A End_A Interval Value 1 5 1990-03-01 2017-03-10 1990-03-01 UTC--2017-03-10 UTC Cat1 2 10 1993-12-01 2017-12-02 1993-12-01 UTC--2017-12-02 UTC Cat2 3 5 ...
Como usar os pandas para imprimir a diferença de duas colunas?
Eu tenho dois conjuntos de dados Em um conjunto, ele possui uma coluna com uma lista de endereços de email: DF1 Email [email protected] [email protected] [email protected] [email protected] [email protected] csv Dataframe2 Email [email protected] [email protected] ...
Dataframe selecionando Max para uma coluna, mas gera valores de outra
Eu tenho um dataframe com valores semelhantes aos abaixo A10d B10d C10d A B C Strategy 20 10 5 3 5 1 3A estratégia seleciona o máximo de A10d, B10d, C10d e retorna o valor de A, B, C. Nesse caso, A10d é o maior e a estratégia retorna A, valor de ...
dict objetos convertidos em string quando lidos de csv para dataframe pandas python
Eu tenho um arquivo csv, que tem muitas colunas. Uma coluna contém dados na forma de objetos dict, bem como cadeias. Por exemplo: a coluna contém dados como: {"a": 5, "b": 6, "c": 8}, "usa", "india", {"a": 9, "b": 10 ", c ": 11} Quando li este ...