Resultados da pesquisa a pedido "pandas"
Como passar um parâmetro para apenas uma parte de um objeto de pipeline no scikit learn?
Eu preciso passar um parâmetrosample_weight, para o meuRandomForestClassifier igual a: X = np.array([[2.0, 2.0, 1.0, 0.0, 1.0, 3.0, 3.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 5.0, 3.0, 2.0, ...
como plotar o tempo no eixo y no formato '% H:% M' no matplotlib?
eu gostaria de plotar os horários de uma série datetime64, onde o eixo y é formatado como '% H:% M, mostrando apenas 00:00, 01:00, 02:00, etc. é assim que o gráfico se parece sem personalizar a formatação do eixo y. import numpy as np import ...
A maneira mais eficiente de converter valores de coluna no Pandas DataFrame
Eu tenho um pd.DataFrame que se parece com: [/imgs/17YRS.png] Eu quero criar um ponto de corte nos valores para colocá-los em dígitos binários, meu ponto de corte neste caso é0.85. Quero que o quadro de dados resultante tenha a seguinte ...
Matriz Python Pandas Distance usando similaridade jaccard
Eu implementei uma função para construir uma matriz de distância usando a semelhança jaccard: import pandas as pd entries = [ {'id':'1', 'category1':'100', 'category2': '0', 'category3':'100'}, {'id':'2', 'category1':'100', 'category2': ...
Como contar linhas duplicadas no dataframe do pandas?
Estou tentando contar as duplicatas de cada tipo de linha no meu quadro de dados. Por exemplo, digamos que eu possua um quadro de dados nos pandas da seguinte maneira: df = pd.DataFrame({'one': pd.Series([1., 1, 1]), 'two': pd.Series([1., 2., ...
Valor máximo do Python Pandas em um grupo como uma nova coluna
Estou tentando calcular uma nova coluna que contém valores máximos para cada um dos vários grupos. Eu sou proveniente de um background Stata, então eu sei que o código Stata seria algo como isto: by group, sort: egen max = max(odds)Por ...
Leitura no arquivo csv como dataframe de hdfs
Estou usando o pydoop para ler um arquivo de hdfs e quando uso: import pydoop.hdfs as hd with hd.open("/home/file.csv") as f: print f.read()Ele me mostra o arquivo no stdout. Existe alguma maneira de eu ler esse arquivo como dataframe? Eu ...
Dividindo a coluna do registro de data e hora em colunas separadas de data e hora
Eu tenho um dataframe de pandas com mais de 1000 registros de data e hora (abaixo) que gostaria de percorrer: 2016-02-22 14:59:44.561776Estou com dificuldade para dividir esse carimbo de data / hora em 2 colunas - 'data' e 'hora'. O formato da ...
Lendo csv de pandas com quotechar e delimitador para um valor de coluna
Aqui está o conteúdo de um arquivo csv 'test.csv', estou tentando lê-lo via pandas read_csv () "col1", "col2", "col3", "col4" "v1", "v2", "v3", "v4" "v21", "v22", "v23", "this, "creating, what to do? " problems"Este é o comando que estou usando ...
Expressando subconjunto de pandas usando pipe
Eu tenho um dataframe que eu subconjunto assim: a b x y 0 1 2 3 -1 1 2 4 6 -2 2 3 6 6 -3 3 4 8 3 -4 df = df[(df.a >= 2) & (df.b <= 8)] df = df.groupby(df.x).mean()Como expresso isso usando o operador de tubo do pandas? df = (df .pipe((x.a > 2) ...