, Мало того, что в новой потоковой архитектуре Spark, называемой «структурированной потоковой передачей», состояние встроено в конвейер и в основном абстрагировано от пользователя, чтобы иметь возможность выставлять операторы агрегирования, такие как

e Spark хвастается тем, что его операторы (узлы) "не сохраняют состояния". Это позволяет архитектуре Spark использовать более простые протоколы для таких вещей, как восстановление, балансировка нагрузки и обработка отставших.

С другой стороныАпач флинк описывает своих операторов как «с состоянием» и заявляет, что они необходимы для таких приложений, как машинное обучение. Тем не менее, программы Spark могут передавать информацию и поддерживать данные приложений в СДР, не поддерживая «состояние».

Что здесь происходит? Разве Spark не является настоящей системой без сохранения состояния? Или утверждение Флинка о том, что отслеживание состояния важно для машинного обучения и подобных приложений, неверно? Или здесь есть какой-то дополнительный нюанс?

Я не чувствую, что действительно чувствую разницу между системами с «состоянием с состоянием» и «без гражданства», и я был бы признателен, если бы их можно было объяснить

Ответы на вопрос(1)

Ваш ответ на вопрос