construir una lista de bordes de co-ocurrencia de palabras en R
Tengo un montón de oraciones y quiero construir la lista de bordes no dirigida de la coincidencia de palabras y ver la frecuencia de cada borde. Eché un vistazo a latm
paquete pero no encontró funciones similares. ¿Hay algún paquete / script que pueda usar? ¡Muchas gracias!
Nota: Una palabra no coexiste consigo misma. Una palabra que aparece dos veces o más coincide con otras palabras solo una vez en la misma oración.
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
SALIDA
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1