construir una lista de bordes de co-ocurrencia de palabras en R

Question

Nov 26, 2014, 04:46 PM

construir una lista de bordes de co-ocurrencia de palabras en R

Tengo un montón de oraciones y quiero construir la lista de bordes no dirigida de la coincidencia de palabras y ver la frecuencia de cada borde. Eché un vistazo a latm paquete pero no encontró funciones similares. ¿Hay algún paquete / script que pueda usar? ¡Muchas gracias!

Nota: Una palabra no coexiste consigo misma. Una palabra que aparece dos veces o más coincide con otras palabras solo una vez en la misma oración.

DF:

sentence_id text
1           a b c d e
2           a b b e
3           b c d
4           a e
5           a
6           a a a

SALIDA

word1 word2 freq
a     b     2
a     c     1
a     d     1
a     e     3
b     c     2
b     d     2
b     e     2
c     d     2
c     e     1
d     e     1