Estrategias para encontrar direcciones de correo duplicadas.

Estoy tratando de encontrar un método para encontrar direcciones duplicadas, basado en una puntuación de similitud. Considere estas direcciones duplicadas:

addr_1 = '# 3 FAIRMONT LINK SOUTH'
addr_2 = '3 FAIRMONT LINK S'

addr_3 = '5703 - 48TH AVE'
adrr_4 = '5703- 48 AVENUE'

Estoy planeando aplicar alguna transformación de cadena para hacer que las palabras largas sean abreviadas, como NORTE -> N, eliminar todos los espacios, comas y guiones y símbolos de libra. Ahora, teniendo esta salida, ¿cómo puedo comparar addr_3 con el resto de direcciones y detectar similares? ¿Qué porcentaje de similitud sería seguro? ¿Podrías proporcionar un código Python simple para esto?

addr_1 = '3FAIRMONTLINKS'
addr_2 = '3FAIRMONTLINKS'

addr_3 = '570348THAV'
adrr_4 = '570348AV'

Agradecido,

Eduardo