Resultados da pesquisa a pedido "window-functions"
Particionando por várias colunas no Spark SQL
Com as funções de janela do Spark SQL, preciso particionar por várias colunas para executar minhas consultas de dados, da seguinte maneira: val w = Window.partitionBy($"a").partitionBy($"b").rangeBetween(-100, 0) No momento, não tenho um ...
Sessione uma coluna de números em grupos de 30 assim que um limite for atingido no Teradata
Considere uma coluna que representa "tempo entre eventos": (5, 40, 3, 6, 0, 9, 0, 4, 5, 18, 2, 4, 3, 2) Gostaria de agrupá-los em baldes de 30, mas baldes que são redefinidos. Resultado desejado: (0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, ...
lag para obter o primeiro valor não nulo desde o valor nulo anterior
Abaixo está um exemplo do que estou tentando obter em um banco de dados Redshift. Eu tenho uma variávelcurrent_value e eu quero criar uma nova colunavalue_desired isso é: o mesmo quecurrent_value se a linha anterior for nulaigual ao último ...
A filtragem por função da janela resulta no Postgresql
Ok, inicialmente isso foi apenas uma piada que tivemos com um amigo meu, mas isso se tornou uma questão técnica interessante :) Eu tenho o seguintestuff mesa: CREATE TABLE stuff ( id serial PRIMARY KEY, volume integer NOT NULL DEFAULT ...
Selecione uma linha aleatória para cada grupo
Eu tenho uma mesa assim
pyspark: contagem distinta em uma janela
Eu apenas tentei fazer um countDistinct em uma janela e recebi este erro: AnalysisException: u'Distinct window functions are not supported: count(distinct color#1926)Existe uma maneira de fazer uma contagem distinta em uma janela ...
Função de tabela de referência cruzada no Postgres retornando uma saída de uma linha quando espero várias linhas
Atualmente tenho uma mesam do seguinte formato: id scenario period ct 2 1 1 1 2 1 2 1 2 1 3 1 2 1 4 1 2 2 1 1 2 2 2 1 2 2 3 1 2 2 4 1 2 3 1 1 2 3 2 1 2 3 3 1 2 3 4 1Eu quero criar a seguinte tabela: id scenario period 1 2 3 4 2 1 1 1 2 1 2 1 2 ...
Funções da janela Spark - intervalo entre datas
Estou tendo um Spark SQLDataFrame com dados e o que estou tentando obter são todas as linhas que precedem a linha atual em um determinado período. Então, por exemplo, eu quero ter todas as linhas de 7 dias antes da linha especificada. Eu descobri ...
função da janela spark sql lag
Eu estou olhando para a função de slide da janela para um Spark DataFrame no Spark SQL, Scala. Eu tenho um dataframe com colunas Col1, Col1, Col1, data. Col1 Col2 Col3 date volume new_col 201601 100.5 201602 120.6 100.5 201603 450.2 120.6 ...