estratégias para encontrar endereços de correspondência duplicados

Estou tentando encontrar um método para encontrar endereços duplicados, com base em uma pontuação de similaridade. Considere estes endereços duplicados:

addr_1 = '# 3 FAIRMONT LINK SOUTH'
addr_2 = '3 FAIRMONT LINK S'

addr_3 = '5703 - 48TH AVE'
adrr_4 = '5703- 48 AVENUE'

Estou planejando aplicar algumas transformações de strings para tornar as palavras longas abreviadas, como NORTH -> N, remover todos os espaços, vírgulas, traços e símbolos de libra. Agora, tendo esta saída, como posso comparar addr_3 com o resto dos endereços e detectar semelhante? Qual porcentagem de similaridade seria segura? Você poderia fornecer um código python simples para isso?

addr_1 = '3FAIRMONTLINKS'
addr_2 = '3FAIRMONTLINKS'

addr_3 = '570348THAV'
adrr_4 = '570348AV'

Grato,

Eduardo

questionAnswers(6)

yourAnswerToTheQuestion