Was ist eine gute Heuristik für das Einfädeln von Tweets?

Jeder weiß, ob Sie E-Mails, die Sie verwenden, einfädeln möchtenJamie Zawinskis Algorithmus. Aber es ist ein neues Jahrhundert und es gibt einen neuen Nachrichtendienst.

Was ist der beste Algorithmus für Threading-Statusaktualisierungen, die auf Twitter veröffentlicht wurden?

Things Ich möchte auf jeden Fall damit fertig werden:

Der einfache Teil: mitin_reply_to_status_id, in_reply_to_user_id undin_reply_to_screen_name. (Übrigens wäre es nützlich, eine ordnungsgemäße Dokumentation dieser Werte zu finden. Eine solche Dokumentation ist offensichtlich nicht mit from @ verknüpfHie, zum Beispiel.

Gute Heuristik für den Rückschluss auf eine "Antwort" -Beziehung aus Nachrichten, in denen ein Benutzer mit dem @ -Zeichen erwähnt wi@ Konvention, aber nicht explizit als Antwort auf eine bestimmte Nachricht. Diese "Erwähnungen"wird jetzt im Element "entity" des Status angegeben wenn du das anfragst. Diese Heuristiken berücksichtigen möglicherweise (a) die Zeit zwischen zwei Statusaktualisierungen, (b) ob es nachfolgende Antworten zwischen den beiden Benutzern gibt usw. (Antworten, die aus einem Retweet im alten Stil mit einem zusätzlichen Kommentar bestehen, wie Erwähnt von user85509 unten sind nur ein Beispiel für diesen Antwortstil.)

Gespräche, die zwischen mehr als zwei Benutzern stattfinden.

Arbeiten mit einer Reihe von Tweets, die dem Algorithmus zugewiesen wurden, oder mit allen Tweets auf Twitter.

... aber vielleicht fällt dir noch mehr ein.

Antworten auf die Frage(4)

Ihre Antwort auf die Frage