Existe uma maneira de obter resultados diferentes para a mesma consulta SQL se os dados permanecerem os mesmo
Recebo um conjunto de resultados diferente para esta consulta de forma intermitente quando a executo ... às vezes fornece resultados 1363, às vezes 1365 e às vezes 1366. Os dados não mudam. O que poderia estar causando isso e existe uma maneira de evitá-lo? A consulta é mais ou menos assim:
SELECT *
FROM
(
SELECT
RC.UserGroupId,
RC.UserGroup,
RC.ClientId AS CLID,
CASE WHEN T1.MultipleClients = 1 THEN RC.Salutation1 ELSE RC.DisplayName1 END AS szDisplayName,
T1.MultipleClients,
RC.IsPrimaryRecord,
RC.RecordTypeId,
RC.ClientTypeId,
RC.ClientType,
RC.IsDeleted,
RC.IsCompany,
RC.KnownAs,
RC.Salutation1,
RC.FirstName,
RC.Surname,
Relationship,
C.DisplayName Client,
RC.DisplayName RelatedClient,
E.Email,
RC.DisplayName + ' is the ' + R.Relationship + ' of ' + C.DisplayName Description,
ROW_NUMBER() OVER (PARTITION BY E.Email ORDER BY Relationship DESC) AS sequence_id
FROM
SSDS.Client.ClientExtended C
INNER JOIN
SSDS.Client.ClientRelationship R WITH (NOLOCK)ON C.ClientId = R.ClientID
INNER JOIN
SSDS.Client.ClientExtended RC WITH (NOLOCK)ON R.RelatedClientId = RC.ClientId
LEFT OUTER JOIN
SSDS.Client.Email E WITH (NOLOCK)ON RC.ClientId = E.ClientId
LEFT OUTER JOIN
SSDS.Client.UserDefinedData UD WITH (NOLOCK)ON C.ClientId = UD.ClientId AND C.UserGroupId = UD.UserGroupId
INNER JOIN
(
SELECT
E.Email,
CASE WHEN (COUNT(DISTINCT RC.DisplayName) > 1) THEN 1 ELSE 0 END AS MultipleClients
FROM
SSDS.Client.ClientExtended C
INNER JOIN
SSDS.Client.ClientRelationship R WITH (NOLOCK)ON C.ClientId = R.ClientID
INNER JOIN
SSDS.Client.ClientExtended RC WITH (NOLOCK)ON R.RelatedClientId = RC.ClientId
LEFT OUTER JOIN
SSDS.Client.Email E WITH (NOLOCK)ON RC.ClientId = E.ClientId
LEFT OUTER JOIN
SSDS.Client.UserDefinedData UD WITH (NOLOCK)ON C.ClientId = UD.ClientId AND C.UserGroupId = UD.UserGroupId
WHERE
Relationship IN ('z-Group Principle', 'z-Group Member ')
AND E.Email IS NOT NULL
GROUP BY E.Email
) T1 ON E.Email = T1.Email
WHERE
Relationship IN ('z-Group Principle', 'z-Group Member ')
AND E.Email IS NOT NULL
) T
WHERE
sequence_id = 1
AND T.UserGroupId IN (Select * from iCentral.dbo.GetSubUserGroups('471b9cbd-2312-4a8a-bb20-35ea53d30340',0))
AND T.IsDeleted = 0
AND T.RecordTypeId = 1
AND T.ClientTypeId IN
(
'1', --Client
'-1652203805' --NTU
)
AND T.CLID NOT IN
(
SELECT DISTINCT
UDDF.CLID
FROM
SLacsis_SLM.dbo.T_UserDef UD WITH (NOLOCK)
INNER JOIN
SLacsis_SLM.dbo.T_UserDefData UDDF WITH (NOLOCK)
ON UD.UserDef_ID = UDDF.UserDef_ID
INNER JOIN
SLacsis_SLM.dbo.T_Client CLL WITH (NOLOCK)
ON CLL.CLID = UDDF.CLID AND CLL.UserGroup_CLID = UD.UserID
WHERE
UD.UserDef_ID in
(
'F68F31CE-525B-4455-9D50-6DA77C66FEE5',
'A7CECB03-866C-4F1F-9E1A-CEB09474FE47'
)
AND UDDF.Data = 'NO'
)
ORDER BY T.Surname
EDITAR
Eu removi todos os NOLOCKs (incluindo os de visualizações e UDFs) e ainda estou tendo o mesmo problema. Eu sempre recebo os mesmos resultados para a seleção aninhada (T) e, se eu colocar o conjunto de resultados de T em uma tabela temporária no início da consulta e ingressar na tabela temporária em vez da seleção aninhada, o conjunto de resultados final será o mesmo sempre que executo a consulta.
EDIT2:
Estive lendo um pouco mais sobre ROW_NUMBER () ... estou particionando por email (das quais existem duplicatas) e solicitando por Relacionamento (onde existem apenas 1 de 2 relacionamentos). Isso poderia fazer com que a consulta não fosse determinística e haveria uma maneira de corrigir isso?
EDIT3:
Aqui estão os planos de execução reais, se alguém estiver interessadohttp: //www.mediafire.com/? qo5gkh5dftxf0ml. É possível ver que está sendo executado conforme a leitura confirmada do plano de execução? Comparei os arquivos usando o WinMerge e as únicas diferenças parecem ser as contagens (ActualRows = "").
EDIT4:
Isso funciona
SELECT * FROM
(
SELECT *,
ROW_NUMBER() OVER (PARTITION BY B.Email ORDER BY Relationship DESC) AS sequence_id
FROM
(
SELECT DISTINCT
RC.UserGroupId,
...
) B...
EDIT5:
Ao executar a mesma consulta ROW_NUMBER () (T na pergunta original, basta selecionar RC.DisplayName e ROW_NUMBER) duas vezes seguidas, recebo uma classificação diferente para algumas pessoas:
Alguém tem uma boa explicação / exemplo de por que ou como ROW_NUMBER () em um conjunto de resultados que contém duplicatas pode ter uma classificação diferente cada vez que é executado e, finalmente, alterar o número de resultados?
EDIT6:
Ok, acho que isso faz sentido para mim agora. Isso ocorre quando as pessoas 2 pessoas têm o mesmo endereço de e-mail (por exemplo, um casal de marido e mulher) e relacionamento. Acho que, nesse caso, o ranking ROW_NUMBER () é arbitrário e pode mudar toda vez que é executado.