Resultados da pesquisa a pedido "dataframe"
Determinar o número de valores de NA em uma coluna
Eu quero contar o número deNA valores em uma coluna do quadro de dados. Digamos que meu quadro de dados seja chamadodfe o nome da coluna que estou considerando écol. A maneira como inventei é a seguinte: sapply(df$col, function(x) ...
OSError: Falha na inicialização do arquivo no CSV no Pandas
Eu já examinei todas as postagens semelhantes sobre esse problema, mas não consegui encontrar nenhuma solução ... Até agora, o Pandas leu todos os meus arquivos CSV sem nenhum problema, mas agora parece haver um problema .. Ao fazer: df = ...
Como crio amostras de teste e treinamento de um quadro de dados com pandas?
Eu tenho um conjunto de dados bastante grande na forma de um quadro de dados e queria saber como seria capaz de dividir o quadro de dados em duas amostras aleatórias (80% e 20%) para treinamento e teste. Obrigado!
função personalizada após agrupar data.fame
Dados os seguintes data.frame d <- rep(c("a", "b"), each=5) l <- rep(1:5, 2) v <- 1:10 df <- data.frame(d=d, l=l, v=v*v) df d l v 1 a 1 1 2 a 2 4 3 a 3 9 4 a 4 16 5 a 5 25 6 b 1 36 7 b 2 49 8 b 3 64 9 b 4 81 10 b 5 100Agora eu quero adicionar ...
pandas: classifique cada coluna individualmente
Meu dataframe se parece com isso, só que muito maior. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...
Pandas: como classificar o quadro de dados por coluna E por índice
Dado o DataFrame: import pandas as pd df = pd.DataFrame([6, 4, 2, 4, 5], index=[2, 6, 3, 4, 5], columns=['A'])Resulta em: A 2 6 6 4 3 2 4 4 5 5Agora, gostaria de classificar por valores da coluna A e o índice. por ...
Como converter dados de arquivos PDF em quadros de dados
Estou tentando converter os dados de um grande número de arquivos PDF em quadros de dados em R. Eu tenho convertido os arquivos PDF em arquivos .txt usando read.fwf (), mas o problema é a largura de todos. arquivos txt não são os mesmos. Existe ...
Opções de read_csv low_memory e dtype do Pandas
Ao ligar df = pd.read_csv('somefile.csv')Eu recebo: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: colunas (4,5,7,16) têm tipos mistos. Especifique a opção dtype na importação ou defina ...
Obtenha o primeiro elemento da série sem conhecer o índice [duplicado]
Esta pergunta já tem uma resposta aqui: Pandas - obtém o valor da primeira linha de uma determinada coluna [/questions/25254016/pandas-get-first-row-value-of-a-given-column] 5 respostasÉ assim que eu posso obter o primeiro elemento do Seires sem ...
Como combinar várias condições para subconjunto de um quadro de dados usando "OU"?
Eu tenho um data.frame em R. Quero tentar duas condições diferentes em duas colunas diferentes, mas quero que essas condições sejam inclusivas. Portanto, eu gostaria de usar "OR" para combinar as condições. Eu usei a seguinte sintaxe antes com ...