Resultados da pesquisa a pedido "dataframe"
Grupo MultiIndex por no quadro de dados do Pandas
Eu tenho um conjunto de dados que contém países e estatísticas sobre indicadores econômicos por ano, organizados da seguinte forma: Country Metric 2011 2012 2013 2014 USA GDP 7 4 0 2 USA Pop. 2 3 0 3 GB GDP 8 7 0 7 GB Pop. 2 6 0 0 FR GDP 5 0 0 1 ...
Calcular estatísticas resumidas das colunas no dataframe
Eu tenho um quadro de dados do seguinte formulário (por exemplo) shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method 1,FALSE,0,0,MX, 2,FALSE,1,0,MX, 3,FALSE,0,0,MX, 4,FALSE,22,0,MX, ...
Carregar uma pequena amostra aleatória de um arquivo csv grande no quadro de dados R
O arquivo csv a ser processado não cabe na memória. Como se pode ler ~ 20K linhas aleatórias para fazer estatísticas básicas no quadro de dados selecionado?
Qual é a diferença entre lm (ofensa $ R ~ ofensa $ OBP) e lm (R ~ OBP)?
Estou tentando usar R para criar um modelo linear e usá-lo para prever alguns valores. O assunto é estatísticas de beisebol. Se eu fizer isso: obp <- lm(offense$R ~ offense$OBP) predict(obp, newdata=data.frame(OBP=0.5), interval="predict")Recebo ...
Selecionar linhas de um DataFrame com base nos valores da lista em uma coluna no pandas
Eu sou novo no pandas e tenho um quadro de dados simples e quero extrair determinadas linhas com base em uma coluna. Contudo,o tipo nesta coluna é uma lista. Exemplo: df = pd.DataFrame([['text1', [1,2,3]], ['text2', ...
Como recolher colunas de quadro de dados do Pandas e concatenar seqüências de caracteres
Eu tenho um Data Frame df0 com n colunas. Apenas uma das colunas contém uma sequência, todas as outras colunas estão vazias ou contêm a sequência "". É possível recolher o quadro de dados em um quadro de dados de coluna única onde, para cada ...
Divida os dados aleatoriamente por critério em um conjunto de dados de treinamento e teste usando R
Gidday, Estou procurando uma maneira de dividir aleatoriamente um quadro de dados (por exemplo, divisão 90/10) para testar e treinar um modelo, mantendo um certo critério de agrupamento. Imagine que eu tenho um quadro de dados como este: > ...
Substitua valores em uma série de pandas via dicionário com eficiência
Como substituir valores em uma série Pandass através de um dicionáriod foi solicitado e solicitado novamente várias vezes. O método recomendado (1 [https://stackoverflow.com/a/40855794/9209546], 2 [https://stackoverflow.com/a/40528697/9209546], ...
Por que os modelos estatísticos não podem reproduzir meus resultados de regressão logística R?
Estou confuso sobre o motivo pelo qual meus modelos de regressão logística nos modelos R e stats não concordam. Se eu preparar alguns dados em R com # From https://courses.edx.org/c4x/MITx/15.071x/asset/census.csv library(caTools) # for ...
Contar o número de palavras por linha
Estou tentando criar uma nova coluna em um dataframe que contém a contagem de palavras para a respectiva linha. Eu estou olhando para o número total de palavras, não frequências de cada palavra distinta. Presumi que haveria uma maneira simples / ...