Resultados da pesquisa a pedido "aggregate"
Pandas: usando groupby para obter média para cada categoria de dados
Eu tenho um quadro de dados que se parece com isso: >>> df[['data','category']] Out[47]: data category 0 4610 2 15 4610 2 22 5307 7 23 5307 7 25 5307 7 ... ... ...Os dados e a categoria são numéricos, portanto, eu posso fazer isso: >>> ...
Contando várias linhas no MySQL em uma consulta
Atualmente, tenho uma tabela que armazena uma carga de estatísticas, como visualizações, downloads, compras etc. para um número múltiplo de itens. Para obter uma única contagem de operações em cada item, posso usar a seguinte consulta: SELECT *, ...
Média de vários arquivos CSV em 1 arquivo médio em r
Eu tenho aproximadamente 300 arquivos csv de velocidade, temperatura, pressão, etc, colunas e cada linha é um período diferente de 2007 a 2012. Cada arquivo é de um local diferente. Quero combinar todos os arquivos em um que seja a média de todos ...
Calculando as médias para cada KEY em um RDD Pairwise (K, V) no Spark com Python
Eu quero compartilhar esta solução específica do Apache Spark com Python, porque a documentação para ela é bastante pobre. Eu queria calcular o valor médio dos pares K / V (armazenados em um Pairwise RDD), por KEY. Aqui está a aparência dos ...
Agregue com base em cada item em uma coluna separada por caracteres especiais no Pandas
Eu tenho dados de entrada como dados abaixo Date Investment Type Medium 1/1/2000 Mutual Fund, Stocks, Fixed Deposit, Real Estate Own, Online,Through Agent 1/2/2000 Mutual Fund, Stocks, Real Estate Own 1/3/2000 Fixed Deposit Online 1/3/2000 ...
Somando linhas por mês em R
Então, eu tenho um quadro de dados que possui uma coluna de data, uma coluna de hora e uma série de outras colunas numéricas. Cada linha no quadro de dados é de 1 hora de 1 dia por um ano inteiro. O quadro de dados fica assim: Date Hour ...
Agregando ao mesclar dois quadros de dados no R
O objetivo final é somar a quantidade total (transact_data$qty) para cada registro emproduct_info onde otransact_data$productId existe emproduct_info, e ondetransact_data$date está entreproduct_info$beg_date eproduct_info$end_date. Os quadros de ...
R agregado por grande número de colunas
Eu tenho um quadro de dados (df) que possui cerca de 40 colunas e quero agregar usando uma soma em 4 das colunas. Fora dos 4 que quero somar, cada valor exclusivo na coluna 1 corresponde a valores idênticos no restante das colunas e quero manter ...
Execute uma função personalizada em um quadro de dados em R, por grupo
Problemas para conseguir que uma função personalizada faça loop sobre um grupo em um quadro de dados. Aqui estão alguns dados de amostra: set.seed(42) tm <- as.numeric(c("1", "2", "3", "3", "2", "1", "2", "3", "1", "1")) d <- ...
Como calcular a média em um quadro de dados usando a função agregada em R?
Eu tenho um quadro de dados df1: number=c(4,3,2,3,4,1) year=c("2000","2000","2000", "2015", "2015", "2015") items=c(12, 10, 15, 5, 10, 7) df1=data.frame(number, year, items) setDT(df1)[, Prop := number/sum(number), by = year]de modo que fique ...