R - einfache Datensatzverknüpfung - der nächste Schritt?

Ich versuche eine einfache direkte Verknüpfung mit demlibrary('RecordLinkage').

So habe ich nur einen Vektor

tv3 = c("TOURDEFRANCE", 'TOURDEFRANCE', "TOURDE FRANCE", 
"TOURDE FRANZ", "GET FRESH") 

Die Funktion, die ich brauche, istcompare.dedup deslibrary('RecordLinkage') und ich bekomme:

compare.dedup(as.data.frame(tv3))$pairs

$pairs
id1 id2 tv3 is_match
1    1   2   1       NA
2    1   3   0       NA
3    1   4   0       NA
4    1   5   0       NA
5    2   3   0       NA
....

Ich kann keine Dokumentation für den nächsten Schritt finden. Wie kann ich dann mein ähnliches Paar vergleichen und finden?

So fand ich den Abstandjarowinkler() gibt aber nur Paare zurück. Grundsätzlich können Sie nur @ tjarowinkler(tv3[1], tv3) Einer nach dem anderen

So frage ich: Müssen Sie eine eigene Schleife durchführen, um Ihr Ergebnis zu erhalten, oder gibt es einen direkteren Weg vomcompare.dedup Funktion?

mat = matrix(0, length(tv3), length(tv3))

for(j in 1:length(tv3)){
  for(i in 1:length(tv3)){
    { mat[i,j] = jarowinkler(tv3[j], tv3[i]) }
  }
}

Die Unähnlichkeitsmatrix

> mat
          [,1]      [,2]      [,3]      [,4]      [,5]
[1,] 1.0000000 1.0000000 0.9846154 0.9333333 0.5240741
[2,] 1.0000000 1.0000000 0.9846154 0.9333333 0.5240741
[3,] 0.9846154 0.9846154 1.0000000 0.9525641 0.5133903
[4,] 0.9333333 0.9333333 0.9525641 1.0000000 0.5240741
[5,] 0.5240741 0.5240741 0.5133903 0.5240741 1.0000000

Was ich machen will; was ich vorhabe zu tu ist einfach ein Attribut fürähnlic Objekt "TOURDEFRANCE", 'TOURDEFRANCE', "TOURDE FRANCE", "TOURDE FRANZ"), eines der möglichenähnlic Objektnamen.

Wie könnte ich einen Cut-Off einstellen, sagen wir0.90, auf meiner Unähnlichkeitsmatrix und dannretreive Alle Zeilen desähnlic Objekt

Wenn sich meine Daten in einem Datenrahmen befinden

             tv3
1  TOURDEFRANCE
2  TOURDEFRANCE
3 TOURDE FRANCE
4  TOURDE FRANZ
5     GET FRESH

Do etwas wiewhich cut-off > 0.90 und erhalte die entsprechenden Zeilen?

Jede Hilfe für diese einfache Datensatzverknüpfung ist sehr willkommen!

Antworten auf die Frage(2)

Ihre Antwort auf die Frage