Результаты поиска по запросу "sparklyr"

1 ответ

Спасибо, очень полезный ответ

0 ответов

 где я получил некоторый вклад в другие варианты

ался использовать sparklyr для записи данных в hdfs или hive, но не смог найти способ. Можно ли даже записать R-массив данных в hdfs или куст, используя sparklyr? Пожалуйста, обратите внимание, что мой R и hadoop работают на двух разных серверах, ...

1 ответ

в

олчанию,spark_read_jdbc() читает всю таблицу базы данных в Spark. Я использовал следующий синтаксис для создания этих соединений. library(sparklyr) library(dplyr) config <- spark_config() config$`sparklyr.shell.driver-class-path` ...

ТОП публикаций

1 ответ

Спасибо, сработало!

df <- data.frame(old1 = LETTERS, old2 = 1) df_tbl <- copy_to(sc,df,"df") df_tbl <- df_tbl %>% dplyr::rename(old1 = new1, old2 = new2)ащает: > head(df_tbl) Error: `new1`, `new2` contains unknown variablesЕсть ли простой способ изменить имена ...

1 ответ

spark.rstudio.com/articles/guides-dplyr.html#sql-translation

ичок в sparklyr (но знаком с spark и pyspark), и у меня есть действительно простой вопрос. Я пытаюсь отфильтровать столбец на основе частичного совпадения. В dplyr я бы написал свою операцию так: businesses %>% filter(grepl('test', biz_name)) ...

1 ответ

Большое спасибо за ваш ответ. Я думаю, я посмотрю, сработает ли сбор данных в R для моей программы. Если нет, я посмотрю в расширениях Scala.

я есть широкий фрейм данных из нескольких тысяч столбцов примерно на миллион строк, для которого я хотел бы рассчитать итоговые суммы строк. Мое решение пока ниже. Я использовал:dplyr - сумма нескольких столбцов с использованием регулярных ...

3 ответа

не работает. это не обычный R, это Sparklyr!

я есть несколько раз Unix, которые я конвертирую в метки времени вsparklyr и по некоторым причинам мне также нужно преобразовать их в строки. К сожалению, кажется, что во время преобразования в строкуhive преобразует в EST (мой язык). df_new <- ...

1 ответ

@StatsBoy, пожалуйста, примите один из ответов

аюсь подсчитать количество уникальных элементов в каждом столбце в наборе данных искры. Однако кажется, что искра не распознает тали ()k<-collect(s%>%group_by(grouping_type)%>%summarise_each(funs(tally(distinct(.))))) Error: ...

1 ответ

принимая это

я есть набор данных, как показано ниже. Из-за большого объема данных, я загрузил его черезsparklyr пакет, поэтому я могу использовать только операторы трубы. pos <- str_sub(csj$helpful,2) neg1 <- str_sub(csj$helpful,4) csj <- csj ...

1 ответ

Сгенерированный SQL выглядит так, довольно просто, просто долго:

ние Код R написан с использованием пакета Sparklyr для создания схемы базы данных.[Воспроизводимый код и база данных приведены] Существующий результат root |-- contributors : string |-- created_at : string |-- entities (struct) | |-- hashtags ...