Beste Technik für maschinelles Lernen zum Anpassen von Produktketten

Hier ist ein Puzzle ...

Ich habe zwei Datenbanken mit den gleichen mehr als 50000 elektronischen Produkten und möchte Produkte in einer Datenbank mit denen in der anderen abgleichen. Die Produktnamen sind jedoch nicht immer identisch. Ich habe versucht, den Levenshtein-Abstand zum Messen der String-Ähnlichkeit zu verwenden, aber das hat nicht funktioniert. Zum Beispiel,

-LG 42CS560 42-Inch 1080p 60Hz LCD HDTV
-LG 42 Inch 1080p LCD HDTV

Diese Artikel sind die gleichen, aber ihre Produktnamen variieren ziemlich stark.

Auf der anderen Seite...

-LG 42 Inch 1080p LCD HDTV
-LG 50 Inch 1080p LCD HDTV

Hierbei handelt es sich um verschiedene Produkte mit sehr ähnlichen Produktnamen.

Wie soll ich dieses Problem angehen?

Antworten auf die Frage(2)

Ihre Antwort auf die Frage