, Мало того, что в новой потоковой архитектуре Spark, называемой «структурированной потоковой передачей», состояние встроено в конвейер и в основном абстрагировано от пользователя, чтобы иметь возможность выставлять операторы агрегирования, такие как

Question

Mar 03, 2018, 11:22 PM

apache-flink state spark-streaming apache-spark streaming

, Мало того, что в новой потоковой архитектуре Spark, называемой «структурированной потоковой передачей», состояние встроено в конвейер и в основном абстрагировано от пользователя, чтобы иметь возможность выставлять операторы агрегирования, такие как

e Spark хвастается тем, что его операторы (узлы) "не сохраняют состояния". Это позволяет архитектуре Spark использовать более простые протоколы для таких вещей, как восстановление, балансировка нагрузки и обработка отставших.

С другой стороныАпач флинк описывает своих операторов как «с состоянием» и заявляет, что они необходимы для таких приложений, как машинное обучение. Тем не менее, программы Spark могут передавать информацию и поддерживать данные приложений в СДР, не поддерживая «состояние».

Что здесь происходит? Разве Spark не является настоящей системой без сохранения состояния? Или утверждение Флинка о том, что отслеживание состояния важно для машинного обучения и подобных приложений, неверно? Или здесь есть какой-то дополнительный нюанс?

Я не чувствую, что действительно чувствую разницу между системами с «состоянием с состоянием» и «без гражданства», и я был бы признателен, если бы их можно было объяснить

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы