сходство двух целых текстов с использованием расстояния Левенштейна [закрыто]

У меня есть два текстовых файла, которые яхотел бы сравнить. То, что я сделал, это: я

Я разделил их на предложения.мы измерили левенштейновское расстояние между каждым из предложений из одного файла с каждым из предложений из второго файла.

Мне бы хотелось вычислить среднее сходство между этими двумя текстовыми файлами, однако у меня возникли проблемы с доставкой какого-либо значимого значения - очевидно, среднее арифметическое (сумма всех [нормализованных] расстояний, деленная на число сравнений) - плохая идея.

Как интерпретировать такие результаты?

редактировать: значения расстояния нормализуются.

Ответы на вопрос(1)

Ваш ответ на вопрос