Forma mais eficiente de calcular a distância de Levenshtein
Acabei de implementar um algoritmo de pesquisa de arquivos com melhor correspondência para encontrar a correspondência mais próxima de uma string em um dicionário. Depois de criar um perfil do meu código, descobri que a grande maioria do tempo é gasta calculando a distância entre a consulta e os possíveis resultados. Atualmente, estou implementando o algoritmo para calcular a distância de Levenshtein usando uma matriz 2-D, o que torna a implementação uma operação O (n ^ 2). Eu esperava que alguém pudesse sugerir uma maneira mais rápida de fazer o mesmo.
Aqui está minha implementação:
public int calculate(String root, String query)
{
int arr[][] = new int[root.length() + 2][query.length() + 2];
for (int i = 2; i < root.length() + 2; i++)
{
arr[i][0] = (int) root.charAt(i - 2);
arr[i][1] = (i - 1);
}
for (int i = 2; i < query.length() + 2; i++)
{
arr[0][i] = (int) query.charAt(i - 2);
arr[1][i] = (i - 1);
}
for (int i = 2; i < root.length() + 2; i++)
{
for (int j = 2; j < query.length() + 2; j++)
{
int diff = 0;
if (arr[0][j] != arr[i][0])
{
diff = 1;
}
arr[i][j] = min((arr[i - 1][j] + 1), (arr[i][j - 1] + 1), (arr[i - 1][j - 1] + diff));
}
}
return arr[root.length() + 1][query.length() + 1];
}
public int min(int n1, int n2, int n3)
{
return (int) Math.min(n1, Math.min(n2, n3));
}