Результаты поиска по запросу "apache-spark-sql"
Как рассчитать процентиль столбца в DataFrame в искре?
Я пытаюсь вычислить процентиль столбца в DataFrame? Я не могу найти любую функцию% процентиля в приложении агрегации Spark.Например, в Hive у нас есть процен...
Как импортировать несколько CSV-файлов в одной загрузке?
Предположим, у меня есть определенная схема для загрузки 10 CSV-файлов в папку. Есть ли способ автоматически загружать таблицы с помощью Spark SQL. Я знаю, ч...
PySpark: несколько условий в предложении когда
Я хотел бы изменить значения ячеек столбца данных (Возраст), где в настоящее время он пуст, и я сделал бы это только в том случае, если другой столбец (Выжив...
Разделение на несколько столбцов в Spark SQL
С оконными функциями Spark SQL мне нужно разделить на несколько столбцов для выполнения моих запросов данных, как показано ниже:
Не могу импортировать sqlContext.implicits._ без ошибки через Jupyter
Когда я пытаюсь использовать
Что такое оптимизированный способ объединения больших таблиц в Spark SQL
Мне нужно объединить таблицы с помощью Spark SQL или Dataframe API. Нужно знать, каким будет оптимизированный способ его достижения.Сценарий это:Все данные п...
Переименуйте поворотный и агрегированный столбец в PySpark Dataframe
С фреймом данных следующим образом:
Что означают столбцы «rawPrediction» и «вероятность» DataFrame в Spark MLlib?
После того, как я обучил LogisticRegressionModel, я преобразовал данные теста DF и получил прогноз DF. И затем, когда я вызываю Forextion.show (), имена выхо...