Was ist / sind die Hauptunterschiede zwischen Flink und Storm?

Question

Jun 08, 2015, 12:29 AM

apache-flink apache-storm flink-streaming

Was ist / sind die Hauptunterschiede zwischen Flink und Storm?

Flink war im Vergleich zu Spark, was meines Erachtens der falsche Vergleich ist, da es ein fensterorientiertes Ereignisverarbeitungssystem mit dem Mikro-Batching vergleicht; Ebenso macht es für mich wenig Sinn, Flink mit Samza zu vergleichen. In beiden Fällen wird eine Echtzeit- mit einer Batch-Ereignisverarbeitungsstrategie verglichen, auch wenn diese im Fall von Samza kleiner ist. Aber ich würde gerne wissen, wie sich Flink mit Storm verhält, der konzeptionell viel ähnlicher zu sein scheint.

Ich habe gefundenDie (Folie 4) dokumentiert den Hauptunterschied als "einstellbare Latenz" für Flink. Ein weiterer Hinweis scheint ein Artikel von @ zu seSlicon Angle das deutet darauf hin, dass sich Flink besser in eine Spark- oder HadoopMR-Welt integriert, aber keine tatsächlichen Details erwähnt oder referenziert werden. Schließlich stellt Fabian Hueske selbst fest,in einem Intervie that "Im Vergleich zu Apache Storm bietet die Stream-Analyse-Funktionalität von Flink eine API auf hoher Ebene und verwendet eine leichtere Fehlertoleranzstrategie, um Garantien für eine genau einmalige Verarbeitung bereitzustellen."

All das ist ein bisschen spärlich für mich und ich verstehe den Punkt nicht ganz. Kann jemand erklären, welches Problem (e) bei der Stream-Verarbeitung in Storm von Flink genau gelöst wird (werden?)? Worauf bezieht sich Hueske bei den API-Problemen und ihrer "leichteren Fehlertoleranzstrategie"?