Результаты поиска по запросу "apache-spark-sql"
Требования к преобразованию кадра данных Spark в кадр данных Pandas / R
Я бегу Спарк на пряжи Hadoop. Как работает это преобразование? Имеется ли метод collect () перед преобразованием?Также мне нужно установить Python и R на каж...
Как использовать источник JDBC для записи и чтения данных в (Py) Spark?
Цель этого вопроса - документировать:шаги, необходимые для чтения и записи данных с использованием соединений JDBC в PySparkВозможные проблемы с источниками ...
Spark задает условия для нескольких столбцов для объединения данных
Как дать больше условий столбца при соединении двух фреймов данных. Например, я хочу запустить следующее:
Сохранить Spark DataFrame как динамическую многораздельную таблицу в Hive
У меня есть пример приложения, работающего для чтения из файлов CSV в кадре данных. Фрейм данных может быть сохранен в таблице Hive в формате паркета, исполь...
Как экспортировать таблицу данных в PySpark в CSV?
Я использую Spark 1.3.1 (PySpark) и сгенерировал таблицу с помощью SQL-запроса. Теперь у меня есть объект, который является
Как отфильтровать строки на основе того, находится ли значение столбца в наборе строк в DataFrame Spark
Есть ли более элегантный способ фильтрации на основе значений в наборе строк?