Resultados da pesquisa a pedido "dataframe"

12 a resposta

Determinar o número de valores de NA em uma coluna

Eu quero contar o número deNA valores em uma coluna do quadro de dados. Digamos que meu quadro de dados seja chamadodfe o nome da coluna que estou considerando écol. A maneira como inventei é a seguinte: sapply(df$col, function(x) ...

6 a resposta

OSError: Falha na inicialização do arquivo no CSV no Pandas

Eu já examinei todas as postagens semelhantes sobre esse problema, mas não consegui encontrar nenhuma solução ... Até agora, o Pandas leu todos os meus arquivos CSV sem nenhum problema, mas agora parece haver um problema .. Ao fazer: df = ...

17 a resposta

Como crio amostras de teste e treinamento de um quadro de dados com pandas?

Eu tenho um conjunto de dados bastante grande na forma de um quadro de dados e queria saber como seria capaz de dividir o quadro de dados em duas amostras aleatórias (80% e 20%) para treinamento e teste. Obrigado!

4 a resposta

função personalizada após agrupar data.fame

Dados os seguintes data.frame d <- rep(c("a", "b"), each=5) l <- rep(1:5, 2) v <- 1:10 df <- data.frame(d=d, l=l, v=v*v) df d l v 1 a 1 1 2 a 2 4 3 a 3 9 4 a 4 16 5 a 5 25 6 b 1 36 7 b 2 49 8 b 3 64 9 b 4 81 10 b 5 100Agora eu quero adicionar ...

2 a resposta

pandas: classifique cada coluna individualmente

Meu dataframe se parece com isso, só que muito maior. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...

2 a resposta

Pandas: como classificar o quadro de dados por coluna E por índice

Dado o DataFrame: import pandas as pd df = pd.DataFrame([6, 4, 2, 4, 5], index=[2, 6, 3, 4, 5], columns=['A'])Resulta em: A 2 6 6 4 3 2 4 4 5 5Agora, gostaria de classificar por valores da coluna A e o índice. por ...

1 a resposta

Como converter dados de arquivos PDF em quadros de dados

Estou tentando converter os dados de um grande número de arquivos PDF em quadros de dados em R. Eu tenho convertido os arquivos PDF em arquivos .txt usando read.fwf (), mas o problema é a largura de todos. arquivos txt não são os mesmos. Existe ...

5 a resposta

Opções de read_csv low_memory e dtype do Pandas

Ao ligar df = pd.read_csv('somefile.csv')Eu recebo: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: colunas (4,5,7,16) têm tipos mistos. Especifique a opção dtype na importação ou defina ...

1 a resposta

Obtenha o primeiro elemento da série sem conhecer o índice [duplicado]

Esta pergunta já tem uma resposta aqui: Pandas - obtém o valor da primeira linha de uma determinada coluna [/questions/25254016/pandas-get-first-row-value-of-a-given-column] 5 respostasÉ assim que eu posso obter o primeiro elemento do Seires sem ...

3 a resposta

Como combinar várias condições para subconjunto de um quadro de dados usando "OU"?

Eu tenho um data.frame em R. Quero tentar duas condições diferentes em duas colunas diferentes, mas quero que essas condições sejam inclusivas. Portanto, eu gostaria de usar "OR" para combinar as condições. Eu usei a seguinte sintaxe antes com ...