Вперед заполнить пропущенные значения в Spark / Python

Question

Jun 30, 2016, 09:46 PM

spark-dataframe hadoop apache-spark pyspark apache-spark-mllib

Вперед заполнить пропущенные значения в Spark / Python

Я пытаюсь заполнить пропущенные значения в моем фрейме данных Spark предыдущим ненулевым значением (если оно существует). Я делал подобные вещи в Python / Pandas, но мои данные слишком велики для Pandas (в маленьком кластере), и я Spark Noob. Спарк может это сделать? Это может сделать это для нескольких столбцов? Если да, то как? Если нет, то есть ли предложения по альтернативным подходам в наборе инструментов who Hadoop?

Спасибо!

Вперед заполнить пропущенные значения в Spark / Python

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Вперед заполнить пропущенные значения в Spark / Python

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы