Resultados da pesquisa a pedido "group-by"
pandas groupby contar ocorrência de seqüência de caracteres sobre a coluna
Quero contar a ocorrência de uma seqüência de caracteres em uma coluna agrupada de dados do pandas. Suponha que eu tenho o seguinte Dataframe: catA catB scores A X 6-4 RET A X 6-4 6-4 A Y 6-3 RET B Z 6-0 RET B Z 6-1 RET Primeiro, quero agrupar ...
grupo de pandas concatenar seqüências de caracteres em várias colunas
Eu tenho esse quadro de dados de pandas: df = DataFrame({'id':['a','b','b','b','c','c'], 'category':['z','z','x','y','y','y'], 'category2':['1','2','2','2','1','2']})que se parece com: category category2 id 0 z 1 a 1 z 2 b 2 x 2 b 3 y 2 b 4 y 1 ...
Consultas básicas do MySQL
dando o próximo banco de dados [/imgs/TpWzM.jpg] Preciso fazer várias consultas, estou tendo problemas ao tentar: Lista de todos os planetas mostrando os soldados com uma patente de capitão e o número de batalhas em cada planeta. ID_PLANET ...
Mysql: contagem de registros (incluindo zero) por mês
Estou tentando contar os registros na minha tabela e agrupá-los por data. Minha consulta atual se parece com o seguinte: SELECT count(*), MONTH(time) as month, YEAR(time) as year FROM myTable GROUP BY month, year ORDER BY year, monthIsso ...
Scala-Spark Chama dinamicamente groupby e agg com valores de parâmetro
Quero escrever um agrupamento personalizado e uma função agregada para obter nomes de colunas especificados pelo usuário e mapa de agregação especificado pelo usuário.Não sei os nomes das colunas e o mapa de agregação na frente. Eu quero escrever ...
Agrupando por data, retorne a linha mesmo que nenhum registro seja encontrado
Eu tenho uma consulta que agrupa todas as entradas de uma tabela e agrupa-as pela coluna datetime. Tudo isso funciona muito bem: SELECT SUM( `value` ) AS `sum` , DATE(`datetime`) AS `dt`` FROM `entry` WHERE entryid = 85 AND DATETIME BETWEEN ...
Como usar o groupby nos pandas para calcular uma porcentagem / proporção total com base nos critérios de outra coluna
Estou tentando descobrir como usar ogroupby funcionar nos pandas para calcular as proporções de valores por ano com um determinado critério Sim / Não. Por exemplo, eu tenho um quadro de dados chamadonames: Name Number Year Sex Criteria 0 name1 ...
pandas: soltar duplicados no grupo por 'data'
Eu tenho o seguinte quadro de dados: url='https://raw.githubusercontent.com/108michael/ms_thesis/master/crsp.dime.mpl.df' df=pd.read_csv(url) df.groupby('date').cid.size() date 2005 7 2006 237 2007 3610 2008 1318 2009 2664 2010 997 2011 6390 ...
pyspark collect_set ou collect_list com groupby
Como posso usarcollect_set oucollect_list em um quadro de dados apósgroupby. por exemplo:df.groupby('key').collect_set('values'). Eu recebo um erro:AttributeError: 'GroupedData' object has no attribute 'collect_set'
Pandas - retorna um dataframe após groupby
Eu tenho pandasdf: Name No A 1 A 2 B 2 B 2 B 3Quero agrupar por colunaNamecoluna de somaNo e, em seguida, retorne um quadro de dados de 2 colunas como este: Name No A 3 B 7Eu tentei: df.groupby(['Name'])['No'].sum()mas não retorna o meu quadro ...