Wyniki wyszukiwania dla "text-mining"

4 odpowiedź

Znajdowanie ngrams w R i porównywanie ngrams w korpusach

11 odpowiedzi

Jak określić (naturalny) język dokumentu?

Mam komplet dokumentów w dwóch językach: angielskim i niemieckim. Nie ma użytecznych metadanych o tych dokumentach, program może przeglądać tylko zawartość. ...

2 odpowiedź

Eksploracja tekstu za pomocą pakietu tm-word - słowo

Robię trochę wyszukiwania tekstu w R za pomocą

1 odpowiedź

Eksploracja tekstu R - jak zmienić tekst w kolumnie ramki danych R na kilka kolumn z częstotliwościami bigramu?

Oprócz pytaniaEksploracja tekstu R - jak zmienić tekst w kolumnie ramki danych R na kilka kolumn z częstotliwościami słów? Zastanawiam się, jak uda mi się st...

2 odpowiedź

Jak odtworzyć ten sam DocumentTermMatrix z nowymi (testowymi) danymi

Załóżmy, że mam dane treningowe oparte na tekście i dane testowe. Mówiąc dokładniej, mam dwa zestawy danych - szkolenia i testy - i oba mają jedną kolumnę, k...

2 odpowiedź

Emotikony w analizie sentymentów Twittera w r

Jak mogę obsługiwać / pozbywać się emotikonów, aby móc sortować tweety do analizy sentymentów?Pobieranie: Błąd w sort.list (y): nieprawidłowe wejścieDziękii ...

2 odpowiedź

Jak wyszukać wzorzec w pliku tekstowym za pomocą Pythona łączącego operacje wyrażeń regularnych i łańcuchowych / plików i przechowywać wystąpienia wzorca?

Więc zasadniczo szukam dokładnie 4-cyfrowego kodu w dwóch nawiasach kątowych w pliku tekstowym. Wiem, że muszę otworzyć plik tekstowy, a następnie analizować...

5 odpowiedzi

TM: czytaj w ramce danych, zachowaj identyfikatory tekstu, konstruuj DTM i dołącz do innego zestawu danych

Używam pakietu tm. Powiedz, że mam ramkę danych złożoną z 2 kolumn i 500 wierszy. Pierwsza kolumna to generowany losowo identyfikator, zawierający zarówno znak, jak i cyfrę: „txF87uyK” Druga kolumna to tekst: „Dzisiejsza pogoda jest dobra. ...

1 odpowiedź

Obliczanie wzmocnienia informacji dla pliku tekstowego?

4 odpowiedź

Math of tm :: findAssocs jak działa ta funkcja?

Używam