zwei ganze Texte Ähnlichkeit mit levenshtein Abstand [geschlossen]

Ich habe zwei Textdateien, die ich vergleichen möchte. Was ich getan habe ist:

Ich habe beide in Sätze aufgeteilt.Ich habe den Abstand zwischen den Sätzen einer Datei und den Sätzen der zweiten Datei gemessen.

Ich möchte die durchschnittliche Ähnlichkeit zwischen diesen beiden Textdateien berechnen, habe jedoch Probleme, einen aussagekräftigen Wert zu liefern - offensichtlich ist das arithmetische Mittel (Summe aller Abstände [normalisiert] geteilt durch die Anzahl der Vergleiche) eine schlechte Idee.

Wie interpretiere ich solche Ergebnisse?

Bearbeiten: Entfernungswerte werden normalisiert.

Antworten auf die Frage(1)

Ihre Antwort auf die Frage