Resultados da pesquisa a pedido "pandas"

3 a resposta

Pandas - Substituir os outliers por groupby mean

Eu tenho um quadro de dados de pandas que gostaria de dividir em grupos, calcular a média e o desvio padrão e, em seguida, substituir todos os valores extremos pela média do grupo. Os valores extremos são definidos como tal se estiverem a mais de ...

1 a resposta

Preencha o Pandas DataFrame com vários índices com interpolação

Eu gostaria debfill effill um multi-índiceDataFrame contendoNaNs (neste caso, oImpVol campo) usando ointerpolate método. Uma seção doDataFrame pode ficar assim: Expiration OptionType Strike ImpVol 2014-12-26 call 140.0 NaN 145.0 NaN 147.0 NaN ...

4 a resposta

Contando o valor positivo consecutivo na matriz Python

Estou tentando contar dias úteis consecutivos nos dados de retorno de capital. Portanto, se um dia positivo for 1 e negativo for 0, uma listay=[0,0,1,1,1,0,0,1,0,1,1] deve retornarz=[0,0,1,2,3,0,0,1,0,1,2]. Eu cheguei a uma solução que é legal ...

4 a resposta

Piso ou teto de uma série de pandas em python?

Eu tenho uma série de pandasseries. Se eu quiser obter o piso ou teto por elementos, existe um método embutido ou eu tenho que escrever a função e usar apply? Eu pergunto porque os dados são grandes, então aprecio a eficiência. Além disso, essa ...

1 a resposta

Como criar um dataframe grande, porém esparso, a partir de um ditado de forma eficiente?

Eu tenho uma matriz grande, mas muito esparsa (50.000 linhas * 100.000 colunas, apenas 10% dos valores são conhecidos). Cada elemento conhecido dessa matriz é um número flutuante de 0,00 a 1,00 e esses valores conhecidos são armazenados em um ...

3 a resposta

Vetorizando uma função em pandas

Eu tenho um quadro de dados que contém uma lista de coordenadas lat / lon: d = {'Provider ID': {0: '10001', 1: '10005', 2: '10006', 3: '10007', 4: '10008', 5: '10011', 6: '10012', 7: '10016', 8: '10018', 9: '10019'}, 'latitude': ...

1 a resposta

pandas to_excel na versão 0.15.2 não está funcionando para objetos de data e hora

Um exemplo simples de escrever umdatetime objeto para o Excel não está funcionando desde que alterei minha versão do pandas para 0.15.2. Estou esquecendo de algo? import pandas as pd import datetime df = pd.DataFrame([datetime.datetime.today()]) ...

2 a resposta

Por que o DataFrame.loc [[1]] 1.800x é mais lento que o df.ix [[1]] e 3.500x que o df.loc [1]?

Tente você mesmo: import pandas as pd s=pd.Series(xrange(5000000)) %timeit s.loc[[0]] # You need pandas 0.15.1 or newer for it to be that slow 1 loops, best of 3: 445 ms per loopAtualizar: isso éum bug legítimo em ...

2 a resposta

Como obter o número de grupos em um objeto groupby em pandas?

Isso seria útil para que eu saiba em quantos grupos únicos eu tenho que executar cálculos. Obrigado. Suponha que o objeto groupby seja chamadodfgroup.

1 a resposta

Gráficos de dispersão em Pandas / Pyplot: Como plotar por categoria com marcadores diferentes

Com base nesta pergunta anterior:Gráficos de dispersão em Pandas / Pyplot: Como plotar por categoria [https://stackoverflow.com/questions/21654635/scatter-plots-in-pandas-pyplot-how-to-plot-by-category] . O código abaixo é a solução para essa ...