Qual é / são as principais diferenças entre Flink e Storm?

Question

Jun 08, 2015, 12:29 AM

apache-flink apache-storm flink-streaming

Qual é / são as principais diferenças entre Flink e Storm?

Flink foicomparado ao Spark, que, a meu ver, é a comparação incorreta porque compara um sistema de processamento de eventos em janelas com o lote em lotes; Da mesma forma, não faz muito sentido comparar Flink com Samza. Nos dois casos, ele compara uma estratégia de processamento de eventos em tempo real e em lote, mesmo que em uma "escala" menor no caso do Samza. Mas eu gostaria de saber como o Flink se compara ao Storm, que parece conceitualmente muito mais semelhante a ele.

eu encontreiesta (Slide 4) documentando a principal diferença como "latência ajustável" para o Flink. Outra dica parece ser um artigo deÂngulo de Slicon isso sugere que o Flink se integra melhor ao mundo Spark ou HadoopMR, mas nenhum detalhe real é mencionado ou referenciado. Finalmente, o próprio Fabian Hueske observaem uma entrevista "Comparado ao Apache Storm, a funcionalidade de análise de fluxo do Flink oferece uma API de alto nível e usa uma estratégia de tolerância a falhas mais leve para fornecer garantias de processamento exatamente uma vez".

Tudo isso é um pouco escasso para mim e não entendi direito. Alguém pode explicar quais problemas com o processamento de fluxo no Storm são (são?) Exatamente resolvidos pelo Flink? A que Hueske se refere pelos problemas da API e sua "estratégia mais leve de tolerância a falhas"?