La mejor técnica de aprendizaje automático para unir cadenas de productos.

Aquí hay un rompecabezas ...

Tengo dos bases de datos de los mismos más de 50000 productos electrónicos y quiero hacer coincidir los productos de una base de datos con los de la otra. Sin embargo, los nombres de los productos no siempre son idénticos. He intentado usar la distancia de Levenshtein para medir la similitud de la cuerda, sin embargo, esto no ha funcionado. Por ejemplo,

-LG 42CS560 42-Inch 1080p 60Hz LCD HDTV
-LG 42 Inch 1080p LCD HDTV

Estos artículos son los mismos, pero los nombres de sus productos varían bastante.

Por otra parte...

-LG 42 Inch 1080p LCD HDTV
-LG 50 Inch 1080p LCD HDTV

Estos son diferentes productos con nombres de productos muy similares.

¿Cómo debo abordar este problema?

Respuestas a la pregunta(2)

Su respuesta a la pregunta