Resultados da pesquisa a pedido "pandas"
Criando histogramas em bin no Spark
Suponha que eu possua um dataframe (df) (Pandas) ou RDD (Spark) com as duas colunas a seguir: timestamp, data 12345.0 10 12346.0 12No Pandas, posso criar um histograma com bin de diferentes comprimentos de bin com bastante facilidade. Por ...
Vetorizando o cálculo da distância de Haversine em Python
Estou tentando calcular uma matriz de distância para uma longa lista de locais identificados por Latitude e Longitude usando o métodoHaversine [https://github.com/mapado/haversine]fórmula que usa duas tuplas de pares de coordenadas para produzir ...
Como ampliar um quadro de dados - pandas
Basicamente, eu quero apenas achatar (talvez não seja um bom termo) por exemplo, com dataframe: A B C 0 1 [1,2] [1, 10] 1 2 [2, 14] [2, 18]Eu quero obter a saída de: A B1 B2 B3 B4 0 1 1 2 1 10 1 2 2 14 2 18Eu ...
Produto cumulativo ou contínuo em um quadro de dados
Oi Eu tenho um quadro de dados com uma coluna e eu simplesmente gostaria de adicionar outra coluna que leva o produto de rolamento da coluna original. Estou pesquisando há algum tempo, mas isso parece uma funcionalidade tão básica - não tenho ...
Veja se existe um valor em um DataFrame
No Python, para verificar se um valor está em uma lista, você pode simplesmente fazer o seguinte: >>>9 in [1,2,3,6,9] TrueEu gostaria de fazer o mesmo com um DataFrame do Pandas, mas infelizmente o Pandas não reconhece essa notação: >>>import ...
Classificar pandas MultiIndex
Eu criei um Dataframe com um MultiIndex usando outro Dataframe: arrays = [df['bus_uid'], df['bus_type'], df['type'], df['obj_uid'], df['datetime']] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['bus_uid', ...
Dicionário Python para o Dataframe do Pandas
Como faço para converter um dicionário python em um quadro de dados do pandas. É assim que faço atualmente, que não é nada elegante. import pandas as pd MyDict={'key1':'value1','key2' : ...
Pandas: diferença de grupo por e tabela dinâmica
Eu comecei a aprender pandas e queria saber se existe alguma diferença entrepandas groupby epandas pivot_table funções. Alguém pode me ajudar a entender a diferença entre eles. Ajuda seria apreciada.
substituir string no dataframe do pandas
Eu tenho um quadro de dados com várias colunas. Quero examinar uma coluna e, se alguma das cadeias de caracteres contiver @, quero substituí-las por outra. Como eu faria isso?
Como ordeno as colunas de um quadro de dados com base nos valores em várias linhas?
Por exemplo, df = pd.DataFrame({'x':[1,1,1,2,3,3], 'y':['a','a','c','b','b','b']}) ct = pd.crosstab(df.x, df.y) ct y a b c x 1 2 0 1 2 0 1 0 3 0 2 0Como classifico as colunas de ct com base nos valores da linha1, linha2 e linha3 (nessa ordem ...