Нечеткое объединение SQL - MSSQL
У меня есть два набора данных. Существующие клиенты и потенциальные клиенты.
Моя главная цель - выяснить, есть ли среди потенциальных клиентов уже существующие клиенты. Тем не менее, соглашения об именах клиентов по наборам данных противоречивы.
СУЩЕСТВУЮЩИЕ КЛИЕНТЫ
Customer / ID
Ed's Barbershop / 1002
GroceryTown / 1003
Candy Place / 1004
Handy Man / 1005
ПОТЕНЦИАЛЬНЫЕ ПОКУПАТЕЛИ
Customer
Eds Barbershop
Grocery Town
Candy Place
Handee Man
Beauty Salon
The Apple Farm
Igloo Ice Cream
Ride-a-Long Bikes
Я хотел бы написать какой-то тип оператора select, как показано ниже, для достижения моей цели:
SELECT a.Customer, b.ID
FROM PotentialCustomers a LEFT JOIN
ExistingCustomers B
ON a.Customer = b.Customer
Результаты будут выглядеть примерно так:
Customer / ID
Eds Barbershop / 1002
Grocery Town / 1003
Candy Place / 1004
Handee Man / 1005
Beauty Salon / NULL
The Apple Farm / NULL
Igloo Ice Cream / NULL
Ride-a-Long Bikes / NULL
Я смутно знаком с понятиями расстояния Левенштейна и двойного метафона, но я не уверен, как применять его здесь.
В идеале я хотел бы, чтобы часть JOIN оператора SELECT читалась примерно так:LEFT JOIN ExistingCustomers as B WHERE a.Customer LIKE b.Customer
но я знаю, что синтаксис неверен.
Любые предложения приветствуются. Спасибо!