Resultados da pesquisa a pedido "pandas"
Variáveis simuladas quando nem todas as categorias estão presentes
Eu tenho um conjunto de quadros de dados em que uma das colunas contém uma variável categórica. Gostaria de convertê-lo em várias variáveis fictícias, caso em que normalmente usariaget_dummies. O que acontece é queget_dummies examina os dados ...
dividindo uma coluna por delimitador pandas python
Eu tenho uma pequena amostra de dados: import pandas as pd import pandas as pd df = {'ID': [3009, 129,119,120,121,122,130,3014,266,849,174,844 ], ...
como carregar um json em um dataframe pandas?
Estou usando umREST API para obter umjson arquivo da seguinte maneira: import urllib2 import pandas as pd import numpy as np import requests request='myrequest' data= requests.get(request) json=data.json() df=pd.DataFrame(json)e o quadro de ...
Preenchendo um DataFrame com números de "sinal"
Eu tenho um DataFrame cheio de carros alegóricos (positivos e negativos) e alguns NaN. Gostaria de substituir cada número flutuante por seu sinal: if it's NaN -> it remains Nan if positive -> replace with 1 if negative -> replace with -1 if zero ...
Erro Sklearn, matriz com 4 dim. Estimador <= 2
Eu tentei importar dados do yahoo finance via panda e depois convertê-los em matrizes via .as_matrix (); depois, ao inserir os dados no classifer para treinar, isso me dá um erro. ValueError: Found array with dim 4. Estimator expected <= 2.Este ...
Gráfico de barras empilhadas de pandas
Eu tenho o seguinte conjunto de dados: SessionId Query 1 a 1 b 2 a 3 b 3 b 3 c 3 aQuero exibir um gráfico de barras empilhadas, onde haverá uma barra para cadaSessão e a barra será composta de cores diferentes para cadaInquerir que possui, o ...
pandas lendo dados CSV formatados com vírgula para separador de milhares
Estou tentando criar um quadro de dados no pandas usando um CSV que é delimitado por ponto e vírgula e usa vírgulas para o separador de milhares de dados numéricos. Existe uma maneira de ler isso para que o tipo da coluna seja float e não string?
Os pandas agrupam duas colunas e obtêm o ditado por valores
Eu tenho um dataframe de pandas: banned_titles = TitleId RelatedTitleId 0 89989 32598 1 89989 3085083 2 95281 3085083quando aplico groupby da seguinte maneira In [84]: banned_titles.groupby('TitleId').groups Out[84]: {89989: [0, 1], ...
Como importar um arquivo de texto no AWS S3 para o pandas sem gravar no disco
Eu tenho um arquivo de texto salvo no S3, que é uma tabela delimitada por tabulação. Quero carregá-lo no pandas, mas não consigo salvá-lo primeiro porque estou executando em um servidor heroku. Aqui está o que eu tenho até agora. import io ...
O que é dtype ('O')?
Eu tenho um quadro de dados em pandas e estou tentando descobrir quais são os tipos de seus valores. Não sei qual é o tipo de coluna'Test'. No entanto, quando eu corromyFrame['Test'].dtype, Eu recebo; dtype('O')O que isto significa?