Resultados da pesquisa a pedido "pandas"

2 a resposta

rótulos de data e hora no eixo x do matplotlib, causando sobreposição descontrolada

Estou tentando traçar um pandaseries com um'pandas.tseries.index.DatetimeIndex'. O rótulo do eixo x se sobrepõe teimosamente e não posso torná-los apresentáveis, mesmo com várias soluções sugeridas. eu tenteisolução stackoverflow sugerindo o ...

3 a resposta

Numpy hstack - “ValueError: todas as matrizes de entrada devem ter o mesmo número de dimensões” - mas elas

Estou tentando juntar duas matrizes numpy. Em uma, tenho um conjunto de colunas / recursos após executar o TF-IDF em uma única coluna de texto. No outro, tenho uma coluna / recurso que é um número inteiro. Portanto, leio em uma coluna de dados de ...

8 a resposta

Leia uma pequena amostra aleatória de um grande arquivo CSV em um quadro de dados Python

O arquivo CSV que desejo ler não cabe na memória principal. Como posso ler algumas linhas aleatórias (~ 10K) e fazer algumas estatísticas simples no quadro de dados selecionado?

4 a resposta

Como obtenho uma contagem resumida de dados ausentes / NaN por coluna em 'pandas'?

NoR Eu posso ver rapidamente uma contagem de dados ausentes usando osummary comando, mas o equivalentepandas Método DataFrame,describe não relata esses valores. Acho que posso fazer algo como len(mydata.index) - mydata.count()para calcular o ...

1 a resposta

Como agregar várias colunas no grupo pandas

Eu criei um panda dataframe mn usando a seguinte entrada: keyA state n1 n2 d1 d2 key1 CA 100 1000 1 2 key2 FL 200 2000 2 4 key1 CA 300 3000 3 6 key1 AL 400 4000 4 8 key2 FL 500 5000 5 2 key1 NY 600 6000 6 4 key2 CA 700 7000 7 6Criaram um objeto ...

1 a resposta

Preencha os valores de NA na série pandas com uma parada

Estou analisando uma série temporal e, com base em certos critérios, posso selecionar as linhas que são ascomeçarou ofimdos eventos. Neste ponto, minha série se parece com isso (deixei de fora alguns valores repetitivos por brevidade): A ...

5 a resposta

obter lista da coluna pandas dataframe [duplicado]

Esta pergunta já tem uma resposta aqui: Como obtenho uma coluna Índice / Série do DataFrame como uma matriz ou lista? [/questions/17241004/how-do-i-get-a-dataframe-index-series-column-as-an-array-or-list] 6 respostasEu tenho um documento do ...

1 a resposta

Erro de memória ao tentar aplicar 'fit_transform ()' no TFidfVectorizer contendo a coluna Pandas Dataframe (contendo cadeias)

Estou tentando uma operação semelhante, como mostradoaqui [https://stackoverflow.com/questions/39303912/tfidfvectorizer-in-scikit-learn-valueerror-np-nan-is-an-invalid-document] . Começo com a leitura em duas colunas de um arquivo CSV que contém ...

0 a resposta

Devemos usar pandas.compat.StringIO ou Python 2/3 StringIO?

StringIO é o objeto de buffer de string semelhante a um arquivo que usamos ao ler o dataframe do pandas a partir do texto, por exemplo"Como criar um DataFrame do Pandas a partir de uma ...

1 a resposta

Selecionar linhas de um DataFrame com base nos valores da lista em uma coluna no pandas

Eu sou novo no pandas e tenho um quadro de dados simples e quero extrair determinadas linhas com base em uma coluna. Contudo,o tipo nesta coluna é uma lista. Exemplo: df = pd.DataFrame([['text1', [1,2,3]], ['text2', ...