Techniken zur Analyse der Twitter-Stimmung

Ich mache ein Projekt über Twitter-Stimmungsanalysen, aber es gibt einige Dinge, über die ich nachdenke.

Da Tweets extrem kurz sind (weniger als 140 Zeichen), gelten die Techniken der Textanalyse am besten. Zum Beispiel. Funktioniert Stemming genauso wie In-Lets-Say-Long-Artikel?

Was ist mit n-Gramm? Macht die Kürze des Tweets es für sie am besten oder am schlechtesten?

Wäre k-next genauer als ein Teil der Spracherkennung?

Wird mein benutzerdefiniertes Twitter-Dataset im Laufe der Zeit irrelevant / beschädigt? Da sich Twitter und die Infos dazu so schnell ändern, ist mir das auch ein großes Anliegen.

Vielen Dank für Ihre Zeit.

PS: Haben Sie einen guten Datensatz zur Twitter-Stimmung im Sinn? Wäre toll, wenn es regelmäßig aktualisiert.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage