Erstellen der Kantenliste für das gleichzeitige Auftreten von Wörtern in R
Ich habe einen Satzblock und möchte die ungerichtete Kantenliste des Wortzusammenspiels erstellen und die Häufigkeit jeder Kante anzeigen. Ich habe mir das @ angesehtm
package hat aber keine ähnlichen Funktionen gefunden. Gibt es ein Paket / Skript, das ich verwenden kann? Danke vielmals
Hinweis: Ein Wort kommt nicht gleichzeitig mit sich selbst vor. Ein Wort, das zweimal oder öfter vorkommt, kommt zusammen mit anderen Wörtern nur einmal im selben Satz vor.
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
AUSGAB
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1