Resultados da pesquisa a pedido "query-optimization"

1 a resposta

Coluna de cardinalidade mais alta primeiro em um índice ao envolver um intervalo?

CREATE TABLE `files` ( `did` int(10) unsigned NOT NULL DEFAULT '0', `filename` varbinary(200) NOT NULL, `ext` varbinary(5) DEFAULT NULL, `fsize` double DEFAULT NULL, `filetime` datetime DEFAULT NULL, PRIMARY KEY (`did`,`filename`), KEY ...

2 a resposta

SQL genérico que o Access e ODBC / Oracle podem entender

Eu tenho uma consulta do MS Access que se baseia em uma tabela ODBC vinculada (Oracle). Estou solucionando o mau desempenho da consulta aqui:Acesso não traduzindo corretamenteTOP predicado para ODBC / Oracle ...

5 a resposta

Otimizando ORDER BY

Estou tentando otimizar esta consulta que classificaposts porreputation campo (1º) e depoisid campo (2º). Sem o primeiro campo, a consulta leva ~ 0,250s, mas com isso leva até ~ 2.500s (significa 10x vezes mais lento, terrível). ...

2 a resposta

Como saber qual consulta de contagem é a mais rápida?

Eu estive explorando otimizações de consulta nas versões recentes do Spark SQL 2.3.0-SNAPSHOT e notei diferentes planos físicos para consultas semanticamente idênticas. Vamos supor que eu precise contar o número de linhas no seguinte conjunto ...

2 a resposta

Qual é a maneira mais rápida de procurar tabelas grandes em busca de pontos dentro do raio MySQL (latitude longitude)

Atualmente, tenho algumas tabelas com mais de 100 mil linhas. Eu estou tentando procurar os dados da seguinte maneira. SELECT *, SQRT(POW(69.1 * (latitude - '49.1044302'), 2) + POW(69.1 * ('-122.801094' - longitude) * COS(latitude / 57.3), 2)) ...

2 a resposta

Entendendo o plano físico da faísca

Estou tentando entender os planos físicos, mas não entendo algumas partes porque elas parecem diferentes dos rdbms tradicionais. Por exemplo, neste plano abaixo, é um plano sobre uma consulta em uma tabela de seção. A consulta é esta: select ...

1 a resposta

A transmissão não ocorre ao ingressar nos quadros de dados no Spark 1.6

Abaixo está o código de exemplo que estou executando. Quando esse trabalho de faísca é executado, as associações ao Dataframe acontecem usando sortmergejoin em vez de broadcastjoin. def joinedDf (sqlContext: SQLContext, txnTable: DataFrame, ...

4 a resposta

Índices MySQL - quais são as melhores práticas de acordo com esta tabela e consultas

Eu tenho esta tabela (linha 500.000) CREATE TABLE IF NOT EXISTS `listings` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `type` tinyint(1) NOT NULL DEFAULT '1', `hash` char(32) NOT NULL, `source_id` int(10) unsigned NOT NULL, `link` ...

1 a resposta

Má otimização / planejamento em consultas baseadas na janela do Postgres (partição por (, agrupar por?)) - aceleração de 1000x

Estamos executando o Postgres 9.3.5. (07/2014) Temos algumas configurações complexas de datawarehouse / relatórios (ETL, visualizações materializadas, indexação, agregações, funções analíticas, ...). O que eu descobri agora pode ser difícil de ...

2 a resposta

Consultar as últimas N linhas relacionadas por linha

Eu tenho a seguinte consulta que busca oid dos últimos Nobservations para cadastation: SELECT id FROM ( SELECT station_id, id, created_at, row_number() OVER(PARTITION BY station_id ORDER BY created_at DESC) AS rn FROM ( SELECT station_id, ...