R Mineração de texto - como alterar textos na coluna do quadro de dados R em várias colunas com frequências bigram?
Além de questionarR Mineração de texto - como alterar textos na coluna do quadro de dados R em várias colunas com frequências de palavras? Eu estou querendo saber como posso conseguir fazer colunas com freqüências de bigramas ao invés de apenas frequências de palavras. Mais uma vez, muito obrigado antecipadamente!
Este é o quadro de dados de exemplo (graças a Tyler Rinker).
person sex adult state code
1 sam m 0 Computer is fun. Not too fun. K1
2 greg m 0 No it's not, it's dumb. K2
3 teacher m 1 What should we do? K3
4 sam m 0 You liar, it stinks! K4
5 greg m 0 I am telling the truth! K5
6 sally f 0 How can we be certain? K6
7 greg m 0 There is no way. K7
8 sam m 0 I distrust you. K8
9 sally f 0 What are you talking about? K9
10 researcher f 1 Shall we move on? Good then. K10
11 greg m 0 I'm hungry. Let's eat. You already? K11
Conjunto de dados acima:
library(qdap); DATA