Техника анализа настроений в Твиттере
я делаю проект по анализу настроений в Твиттере, нонекоторые вещи, которые я обдумываю.
Так как твиты очень короткие (менее 140 символов), то лучше всего применять технику анализа текста. Например. Работает ли так же, как и на входе?скажите- длинные статьи?
А как насчет н-граммов? Делает ли короткость твита лучшим или худшим для них?
Будет ли k-ближайшие точнее, чем часть речевого тегирования?
С течением времени мой пользовательский набор данных Twitter станет неактуальным / поврежденным? Поскольку твиттер и информация о нем меняются так быстро, что также вызывает у меня серьезную озабоченность.
Большое спасибо за ваше время.
PS: Вы имеете в виду какой-нибудь хороший набор данных настроений в твиттере? Было бы здорово, если бы он регулярно обновлялся.