Разделение текста на слова с помощью R и cSplit ()
Я пытаюсь разбить ряд предложений на отдельные слова, то есть разбить текст на части.
Я нашел пакет Rsplitstackshape
он может делать то, что я хочу, ну почти… он усекает вывод до первой и последней 5 строк.
Во всяком случае, это то, что мне нужно сделать:
id text
1 Lorem ipsum dolor sit amet
2 consectetur adipiscing elit
3 Donec euismod enim quis
4 nunc fringilla sodales
5 Etiam tempor ligula vitae
6 pellentesque dictum
7 Quisque non justo scelerisque
8 est facilisis congue quis vel
9 Phasellus ex lorem
10 eleifend at magna vel
11 egestas eleifend massa
Выход:
id word
1 Lorem
1 ipsum
1 dolor
1 sit
1 amet
2 consectetur
2 adipiscing
...
То есть мне нужны слова в отдельных строках, но вместе с идентификатором предложения, которому оно принадлежит.
я пыталсяcSplit(data, "text", " ", "long")
, но это усекает ..
Обновить. FYI,Вот как сделать наоборот