Результаты поиска по запросу "apache-spark"

и уверен, что вы знаете, что делаете при изменении кода: ваше редактирование испортило совершенно хороший ответ, в результате чего возникло исключение (восстановленное в оригинале OP) ...

scala caching dataset

0 ответов

Дата была разделом базы данных красного смещения - в этом случае она не должна требовать сортировки

ружаю большие наборы данных и затем кэширую их для справки по всему коду. Код выглядит примерно так: val conversations = sqlContext.read .format("com.databricks.spark.redshift") .option("url", jdbcUrl) .option("tempdir", ...

pyspark spark-dataframe pyspark-sql apache-spark-sql

0 ответов

Затем вы можете отсортировать столбец «Группа» в любом порядке. Приведенное выше решение почти имеет его, но важно помнить, что row_number начинается с 1, а не с 0.

ьзуя pyspark, я хотел бы иметь возможность сгруппировать фрейм данных spark, отсортировать группу, а затем указать номер строки. Так Group Date A 2000 A 2002 A 2007 B 1999 B 2015Станет Group Date row_num A 2000 0 A 2002 1 A 2007 2 B 1999 0 B 2015 1

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

sql pyspark-sql apache-spark-sql

0 ответов

Предположим, у нас есть 9 цифр после десятичной дроби, нам действительно нужно указать

ичок в Spark SQL и пытаюсь преобразовать строку во временную метку во фрейме данных spark. У меня есть строка, которая выглядит как'2017-08-01T02:26:59.000Z' в столбце с именем time_string Мой код для преобразования этой строки в метку ...

apache-spark-sql scala maven intellij-idea

0 ответов

Кажется, с перерывами. Через некоторое время эта проблема исчезла там, где я был.

я собрал файл scala, используя IntelliJ IDEA, показалась следующая ошибка. Ошибка: scalac: неверная символьная ссылка. Подпись в SQLContext.class ссылается на тип ведения журнала в пакете org.apache.spark, который недоступен. Он может полностью ...

scala rdd

0 ответов

stackoverflow.com/questions/47867743/...

аюсь отфильтровать данные файла в хорошие и плохие данные за дату, поэтому получу 2 файла результатов. Из тестового файла первые 4 строки должны идти в хороших данных и последние 2 строки в плохих данных. У меня 2 вопроса Я не получаю хорошие ...

python

0 ответов

stackoverflow.com/questions/45707205/...

у несколько сообщений, которые содержат ту же ошибку, что и ошибка, которую я получаю, но ни одна из них не приводит меня к исправлению моего кода. Я использовал этот же код много раз без проблем, и теперь у меня проблемы. Вот ошибка, которую я ...

hadoop

0 ответов

Примечание: проверьте, что $ HADOOP_HOME / etc / hadoop является правильным в вашей среде. И spark-env.sh также содержит экспорт HADOOP_HOME.

аюсь запустить Spark, используя пряжу, и я сталкиваюсь с этой ошибкой: Исключение в потоке "main" java.lang.Exception: При работе с главной 'yarn' в среде должен быть установлен либо HADOOP_CONF_DIR, либо YARN_CONF_DIR. Я не уверен, где ...

0 ответов

https://github.com/apache/incubator-livy/blob/412ccc8fcf96854fedbe76af8e5a6fec2c542d25/repl/src/test/scala/org/apache/livy/repl/PythonInterpreterSpec.scala#L105

ентация по Apache Livy скудна: можно ли возвращать наборы результатов Spark SQL-запросов как вызовы REST, используя Apache Livy? Вызывающее приложение мобильное и не может использовать odbc / jdbc для подключения. Так что Spark ThriftServer не ...

performance hadoop apache-spark-sql bigdata

0 ответов

используется для определения разделов задач фреймворка. обычно применяется для операций RDD.

разница междуspark.sql.shuffle.partitions а такжеspark.default.parallelism? Я пытался установить их обоих вSparkSQL, но номер задачи второго этапа всегда 200.

Страница 5 из 167

3 456 7

Вы очень активны! Это здорово!

Результаты поиска по запросу "apache-spark"

Популярные теги

ТОП публикаций