Результаты поиска по запросу "apache-spark-sql"

1 ответ

Требования к преобразованию кадра данных Spark в кадр данных Pandas / R

Я бегу Спарк на пряжи Hadoop. Как работает это преобразование? Имеется ли метод collect () перед преобразованием?Также мне нужно установить Python и R на каж...

3 ответа

Как использовать источник JDBC для записи и чтения данных в (Py) Spark?

Цель этого вопроса - документировать:шаги, необходимые для чтения и записи данных с использованием соединений JDBC в PySparkВозможные проблемы с источниками ...

3 ответа

объединить несколько маленьких файлов в несколько больших файлов в Spark

ТОП публикаций

5 ответов

Равенство DataFrame в Apache Spark

7 ответов

Spark задает условия для нескольких столбцов для объединения данных

Как дать больше условий столбца при соединении двух фреймов данных. Например, я хочу запустить следующее:

1 ответ

Как мне зарегистрировать функцию в sqlContext UDF в Scala?

5 ответов

Сохранить Spark DataFrame как динамическую многораздельную таблицу в Hive

У меня есть пример приложения, работающего для чтения из файлов CSV в кадре данных. Фрейм данных может быть сохранен в таблице Hive в формате паркета, исполь...

5 ответов

Как экспортировать таблицу данных в PySpark в CSV?

Я использую Spark 1.3.1 (PySpark) и сгенерировал таблицу с помощью SQL-запроса. Теперь у меня есть объект, который является

1 ответ

Как отфильтровать строки на основе того, находится ли значение столбца в наборе строк в DataFrame Spark

Есть ли более элегантный способ фильтрации на основе значений в наборе строк?

5 ответов

Как я могу найти размер RDD

я имею