Результаты поиска по запросу "apache-spark"

1 ответ

Почему Spark OneHotEncoder по умолчанию отбрасывает последнюю категорию?

Я хотел бы понять, почему в OneHotEncoder от Spark по умолчанию отбрасывается последняя категория.Например:

7 ответов

SparkR vs sparklyr [закрыто]

Есть ли у кого-нибудь обзор относительно преимуществ / недостатков SparkR по сравнению со sparklyr? Google не дает удовлетворительных результатов, и оба кажу...

1 ответ

Как получить доступ к элементу столбца VectorUDT в кадре данных Spark?

У меня есть датафрейм

ТОП публикаций

1 ответ

SparkSQL на таблицах HBase

1 ответ

Сохраняет ли spark все элементы RDD [K, V] для определенного ключа в одном разделе после «groupByKey», даже если данные для ключа очень большие?

Считайте, что у меня есть PairedRDD, скажем, 10 разделов. Но ключи распределены неравномерно, то есть все 9 разделов с данными принадлежат одному ключу, скажем

4 ответа

Как выбрать последнюю строку, а также как получить доступ к фрейму данных PySpark по индексу?

1 ответ

Является ли запрос к Spark DataFrame на основе CSV быстрее, чем к Parquet?

2 ответа

pyspark: NameError: имя 'spark' не определено

1 ответ

Spark: производительность запросов PySpark + Cassandra

Я настроил Spark 2.0 и Cassandra 3.0 на локальном компьютере (8 ядер, 16 ГБ ОЗУ) для тестирования и отредактировал

1 ответ

Ошибка: не найдено: значение горит / когда - искры скала

Я использую Scala, Spark, IntelliJ и Maven.Я использовал ниже код: