Resultados da pesquisa a pedido "pandas"

1 a resposta

Como passar um parâmetro para apenas uma parte de um objeto de pipeline no scikit learn?

Eu preciso passar um parâmetrosample_weight, para o meuRandomForestClassifier igual a: X = np.array([[2.0, 2.0, 1.0, 0.0, 1.0, 3.0, 3.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 5.0, 3.0, 2.0, ...

2 a resposta

como plotar o tempo no eixo y no formato '% H:% M' no matplotlib?

eu gostaria de plotar os horários de uma série datetime64, onde o eixo y é formatado como '% H:% M, mostrando apenas 00:00, 01:00, 02:00, etc. é assim que o gráfico se parece sem personalizar a formatação do eixo y. import numpy as np import ...

2 a resposta

A maneira mais eficiente de converter valores de coluna no Pandas DataFrame

Eu tenho um pd.DataFrame que se parece com: [/imgs/17YRS.png] Eu quero criar um ponto de corte nos valores para colocá-los em dígitos binários, meu ponto de corte neste caso é0.85. Quero que o quadro de dados resultante tenha a seguinte ...

1 a resposta

Matriz Python Pandas Distance usando similaridade jaccard

Eu implementei uma função para construir uma matriz de distância usando a semelhança jaccard: import pandas as pd entries = [ {'id':'1', 'category1':'100', 'category2': '0', 'category3':'100'}, {'id':'2', 'category1':'100', 'category2': ...

5 a resposta

Como contar linhas duplicadas no dataframe do pandas?

Estou tentando contar as duplicatas de cada tipo de linha no meu quadro de dados. Por exemplo, digamos que eu possua um quadro de dados nos pandas da seguinte maneira: df = pd.DataFrame({'one': pd.Series([1., 1, 1]), 'two': pd.Series([1., 2., ...

2 a resposta

Valor máximo do Python Pandas em um grupo como uma nova coluna

Estou tentando calcular uma nova coluna que contém valores máximos para cada um dos vários grupos. Eu sou proveniente de um background Stata, então eu sei que o código Stata seria algo como isto: by group, sort: egen max = max(odds)Por ...

1 a resposta

Leitura no arquivo csv como dataframe de hdfs

Estou usando o pydoop para ler um arquivo de hdfs e quando uso: import pydoop.hdfs as hd with hd.open("/home/file.csv") as f: print f.read()Ele me mostra o arquivo no stdout. Existe alguma maneira de eu ler esse arquivo como dataframe? Eu ...

7 a resposta

Dividindo a coluna do registro de data e hora em colunas separadas de data e hora

Eu tenho um dataframe de pandas com mais de 1000 registros de data e hora (abaixo) que gostaria de percorrer: 2016-02-22 14:59:44.561776Estou com dificuldade para dividir esse carimbo de data / hora em 2 colunas - 'data' e 'hora'. O formato da ...

1 a resposta

Lendo csv de pandas com quotechar e delimitador para um valor de coluna

Aqui está o conteúdo de um arquivo csv 'test.csv', estou tentando lê-lo via pandas read_csv () "col1", "col2", "col3", "col4" "v1", "v2", "v3", "v4" "v21", "v22", "v23", "this, "creating, what to do? " problems"Este é o comando que estou usando ...

3 a resposta

Expressando subconjunto de pandas usando pipe

Eu tenho um dataframe que eu subconjunto assim: a b x y 0 1 2 3 -1 1 2 4 6 -2 2 3 6 6 -3 3 4 8 3 -4 df = df[(df.a >= 2) & (df.b <= 8)] df = df.groupby(df.x).mean()Como expresso isso usando o operador de tubo do pandas? df = (df .pipe((x.a > 2) ...