Resultados da pesquisa a pedido "pandas"
Usando pyarrow, como você anexa ao arquivo parquet?
Como você anexa / atualiza a umparquet arquivo compyarrow? import pandas as pd import pyarrow as pa import pyarrow.parquet as pq table2 = pd.DataFrame({'one': [-1, np.nan, 2.5], 'two': ['foo', 'bar', 'baz'], 'three': [True, False, True]}) table3 ...
Dataframe selecionando Max para uma coluna, mas gera valores de outra
Eu tenho um dataframe com valores semelhantes aos abaixo A10d B10d C10d A B C Strategy 20 10 5 3 5 1 3A estratégia seleciona o máximo de A10d, B10d, C10d e retorna o valor de A, B, C. Nesse caso, A10d é o maior e a estratégia retorna A, valor de ...
Converter uma coluna que contém uma lista de dicionários em várias colunas no quadro de dados do pandas
Eu tenho um dataframe do Pandas como: pd.DataFrame({'a':[1,2], 'b':[[{'c':1,'d':5},{'c':3, 'd':7}],[{'c':10,'d':50}]]}) Out[2]: a b 0 1 [{u'c': 1, u'd': 5}, {u'c': 3, u'd': 7}] 1 2 [{u'c': 10, u'd': 50}]E quero expandir a coluna 'b' e repetir ...
Pandas Python: crie uma nova coluna para cada valor diferente de uma coluna de origem (com saída booleana como valores da coluna)
Estou tentando dividir uma coluna de origem de um quadro de dados em várias colunas com base em seu conteúdo e preencha essas colunas recém-geradas com um booleano 1 ou 0 da seguinte maneira: Dataframe original: ID source_column A value 1 B NaN ...
Python Pandas - Encontre diferença entre dois quadros de dados
Eu tenho dois quadros de dados DF1 e DF2, onde DF2 é um subconjunto de DF1. Como obtenho um novo quadro de dados (df3), que é a diferença entre os dois quadros de dados? Em outras palavras, um quadro de dados que possui todas as linhas / colunas ...
Rolling Mean em pandas em uma coluna específica
Eu tenho um quadro de dados como este que é importado de um CSV. stock pop Date 2016-01-04 325.316 82 2016-01-11 320.036 83 2016-01-18 299.169 79 2016-01-25 296.579 84 2016-02-01 295.334 82 2016-02-08 309.777 81 2016-02-15 317.397 75 2016-02-22 ...
contar linhas por certa combinação de valores de linha pandas
Eu tenho um quadro de dados (df) como este: v1 v2 v3 0 -30 -15 0 -30 -7.5 0 -30 -11.25 0 -30 -13.125 0 -30 -14.0625 0 -30 -13.59375 0 -10 -5 0 -10 -7.5 0 -10 -6.25 0 -10 -5.625 0 -10 -5.9375 0 -10 -6.09375 0 -5 -2.5 0 -5 -1.25 0 -5 -1.875As ...
Entrelaçar dois quadros de dados
Suponha que eu tenha dois quadros de dadosd1 ed2 d1 = pd.DataFrame(np.ones((3, 3), dtype=int), list('abc'), [0, 1, 2]) d2 = pd.DataFrame(np.zeros((3, 2), dtype=int), list('abc'), [3, 4]) d1 0 1 2 a 1 1 1 b 1 1 1 c 1 1 1 d2 3 4 a 0 0 b 0 0 c 0 0O ...
os pandas mapeiam os dados da coluna com base no valor de outra coluna usando if para determinar qual ditado usar
Eu tenho o seguinte quadro de dados: df = pd.DataFrame([['Person1', 'CT', 2017], ['Person2', 'FL', 2017], ['Person3', 'TX', 2017], ['Person1', 'TX', 2016]], columns=['Name', 'State', 'Year'])E duas tabelas de mapeamento abaixo: state_map = ...
ValueError: Tipo de etiqueta desconhecido: 'desconhecido'
Eu tento executar o seguinte código. Btw, eu sou novo em python e sklearn. import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv('train.csv') train = ...