Спасибо за это Гордон, но мне нужны результаты по дате для всех дней в таблице. Я отредактировал свой вопрос в нужном мне формате.

Question

Apr 16, 2018, 10:04 AM

Спасибо за это Гордон, но мне нужны результаты по дате для всех дней в таблице. Я отредактировал свой вопрос в нужном мне формате.

аюсь получить количество уникальных событий на конкретную дату, откат на 90/30/7 дней назад. У меня это работает на ограниченном количестве строк с запросом ниже, но для больших наборов данных я получаю ошибки памяти из агрегированной строки, которая становится огромной.

Я ищу более эффективный способ достижения того же результата.

Таблица выглядит примерно так:

+---+------------+-------------+
|   |     date   |     userid  |
+---+------------+-------------+
| 1 | 2013-05-14 | xxxxx       |
| 2 | 2017-03-14 | xxxxx       |
| 3 | 2018-01-24 | xxxxx       |
| 4 | 2013-03-21 | xxxxx       |
| 5 | 2014-03-19 | xxxxx       |
| 6 | 2015-09-03 | xxxxx       |
| 7 | 2014-02-06 | xxxxx       |
| 8 | 2014-10-30 | xxxxx       |
| ..| ...        | ...         |
+---+------------+-------------+

Формат желаемого результата:

+---+------------+---------------------------------------------+
|   |     date   | active_users_7_days | active_users_90_days  |
+---+------------+---------------------------------------------+
| 1 | 2013-05-14 | 1240                | 34339                 |
| 2 | 2017-03-14 | 4334                | 54343                 |
| 3 | 2018-01-24 | .....               | .....                 |
| 4 | 2013-03-21 | .....               | .....                 |
| 5 | 2014-03-19 | .....               | .....                 |
| 6 | 2015-09-03 | .....               | .....                 |
| 7 | 2014-02-06 | .....               | .....                 |
| 8 | 2014-10-30 | .....               | .....                 |
| ..| ...        | .....               | .....                 |
+---+------------+---------------------------------------------+

Мой запрос выглядит так:

#standardSQL
    WITH
      T1 AS(
      SELECT
        date,
        STRING_AGG(DISTINCT userid) AS IDs
      FROM
        `consumer.events`
      GROUP BY
        date ),
      T2 AS(
      SELECT
        date,
        STRING_AGG(IDs) OVER(ORDER BY UNIX_DATE(date) RANGE BETWEEN 90 PRECEDING
          AND CURRENT ROW) AS IDs
      FROM
        T1 )
    SELECT
      date,
      (
      SELECT
        COUNT(DISTINCT (userid))
      FROM
        UNNEST(SPLIT(IDs)) AS userid) AS NinetyDays
    FROM
      T2

Спасибо за это Гордон, но мне нужны результаты по дате для всех дней в таблице. Я отредактировал свой вопрос в нужном мне формате.

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Спасибо за это Гордон, но мне нужны результаты по дате для всех дней в таблице. Я отредактировал свой вопрос в нужном мне формате.

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы