Как я могу дополнительно оптимизировать запрос производной таблицы, который работает лучше, чем эквивалент JOINed?

Question

Jul 26, 2009, 05:05 AM

optimization mysql query-optimization sql derived-table

Как я могу дополнительно оптимизировать запрос производной таблицы, который работает лучше, чем эквивалент JOINed?

UPDATE: Я нашел решение. Смотрите мой ответ ниже.

My Question

Как я могу оптимизировать этот запрос, чтобы минимизировать время простоя? Мне нужно обновить более 50 схем с количеством билетов от 100 000 до 2 миллионов. Желательно ли попытаться установить все поля в tickets_extra одновременно? Я чувствую, что здесь есть решение, которое я просто не вижу. Я бился головой об эту проблему уже более суток.

Кроме того, я изначально пытался без использования саб SELECT, но производительность былаmuch хуже, чем у меня сейчас.

Background

Я пытаюсь оптимизировать свою базу данных для отчета, который должен быть запущен. Поля, которые мне нужно агрегировать, очень дороги для вычисления, поэтому я денормализую свойсуществующая схема немного, чтобы приспособить этот отчет. Обратите внимание, что я немного упростил таблицу заявок, удалив несколько десятков ненужных столбцов.

Мой отчет будет агрегировать количество билетов поManager When Created а такжеManager When Resolved, Это сложное отношение изображено здесь:

EAV http://cdn.cloudfiles.mosso.com/c163801/eav.png

Чтобы избежать полдюжины неприятных объединений, необходимых для вычисления этого «на лету», я добавил следующую таблицу в мою схему:

mysql> show create table tickets_extra\G
*************************** 1. row ***************************
       Table: tickets_extra
Create Table: CREATE TABLE `tickets_extra` (
  `ticket_id` int(11) NOT NULL,
  `manager_created` int(11) DEFAULT NULL,
  `manager_resolved` int(11) DEFAULT NULL,
  PRIMARY KEY (`ticket_id`),
  KEY `manager_created` (`manager_created`,`manager_resolved`),
  KEY `manager_resolved` (`manager_resolved`,`manager_created`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
1 row in set (0.00 sec)

Проблема в том, что я нигде не хранил эти данные. Менеджер всегда рассчитывался динамически. я имеюmillions тикетов по нескольким базам данных с одной и той же схемой, которые должны заполнить эту таблицу. Я хочу сделать это настолько эффективным способом, насколько это возможно, но мне не удалось оптимизировать запросы, которые я использую для этого:

INSERT INTO tickets_extra (ticket_id, manager_created)
SELECT
  t.id, 
  su.user_id
FROM (
  SELECT 
    t.id, 
    shift_times.shift_id AS shift_id 
  FROM tickets t
  JOIN shifts ON t.shop_id = shifts.shop_id 
  JOIN shift_times ON (shifts.id = shift_times.shift_id
  AND shift_times.dow = DAYOFWEEK(t.created)
  AND TIME(t.created) BETWEEN shift_times.start AND shift_times.end)
) t
LEFT JOIN shifts_users su ON t.shift_id = su.shift_id
LEFT JOIN shift_positions ON su.shift_position_id = shift_positions.id
WHERE shift_positions.level = 1

Этот запрос занимает более часа для запуска в схеме, которая имеет & gt; 1,7 миллиона билетов. Это неприемлемо для окна обслуживания, которое у меня есть. Кроме того, он даже не обрабатывает вычисление поля manager_resolved, поскольку попытка объединить его в один и тот же запрос приводит к увеличению времени запроса в стратосфере. Моя текущая склонность состоит в том, чтобы держать их отдельно и использовать UPDATE для заполнения поля manager_resolved, но я не уверен.

Наконец, вот вывод EXPLAIN части SELECT этого запроса:

*************************** 1. row ***************************
           id: 1
  select_type: PRIMARY
        table: <derived2>
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 167661
        Extra: 
*************************** 2. row ***************************
           id: 1
  select_type: PRIMARY
        table: su
         type: ref
possible_keys: shift_id_fk_idx,shift_position_id_fk_idx
          key: shift_id_fk_idx
      key_len: 4
          ref: t.shift_id
         rows: 5
        Extra: Using where
*************************** 3. row ***************************
           id: 1
  select_type: PRIMARY
        table: shift_positions
         type: ALL
possible_keys: PRIMARY
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 6
        Extra: Using where; Using join buffer
*************************** 4. row ***************************
           id: 2
  select_type: DERIVED
        table: t
         type: ALL
possible_keys: fk_tickets_shop_id
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 173825
        Extra: 
*************************** 5. row ***************************
           id: 2
  select_type: DERIVED
        table: shifts
         type: ref
possible_keys: PRIMARY,shop_id_fk_idx
          key: shop_id_fk_idx
      key_len: 4
          ref: dev_acmc.t.shop_id
         rows: 1
        Extra: 
*************************** 6. row ***************************
           id: 2
  select_type: DERIVED
        table: shift_times
         type: ref
possible_keys: shift_id_fk_idx
          key: shift_id_fk_idx
      key_len: 4
          ref: dev_acmc.shifts.id
         rows: 4
        Extra: Using where
6 rows in set (6.30 sec)

Большое спасибо за чтение!

Как я могу дополнительно оптимизировать запрос производной таблицы, который работает лучше, чем эквивалент JOINed?

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как я могу дополнительно оптимизировать запрос производной таблицы, который работает лучше, чем эквивалент JOINed?

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы