Результаты поиска по запросу "apache-spark"
Ошибка Apache Spark: не удалось подключиться к akka.tcp: // sparkMaster @
Это наши первые шаги с использованием таких больших данных, как apache spark и hadoop.У нас установлен Cloudera CDH 5.3. Из менеджера Cloudera мы решили уста...
Почему Apache Spark принимает функции не параллельно?
Чтение руководства по Apache Spark наhttp://spark.apache.org/docs/latest/programming-guide.html Говорится :Почему функция take не работает параллельно? Какие...
Spark: сортировать записи по группам?
У меня есть набор записей, которые мне нужны:1) Группировка по «дате», «городу» и «виду»2) Сортировать каждую группу по призуВ моем коде:
Что такое память, зарезервированная на пряже
Мне удалось запустить искровое приложение на Yarn. Однако использование emory довольно странно, как вы можете видеть ниже:http://imgur.com/1k6VvSIЧто означае...
Как открыть / поток .zip файлов через Spark?
У меня есть zip-файлы, которые я хотел бы открыть через Spark. Я могу открыть файл .gzip без проблем из-за поддержки родного кодека Hadoops, но не могу сдела...
обработка логов в реальном времени с использованием Apache Spark Streaming
Я хочу создать систему, в которой я мог бы читать журналы в реальном времени и использовать apache spark для ее обработки. Я сбит с толку, если я должен испо...
Какой тип кластера мне выбрать для Spark?
Я новичок в Apache Spark, и я только что узнал, что Spark поддерживает три типа кластеров:Автономный - это означает, что Spark будет управлять своим собствен...
Как запускать параллельные задания (действия) в Apache Spark, используя единый контекст spark
В документации Apache Spark сказано:в каждом приложении Spark несколько «заданий» (действий Spark) могут выполняться одновременно, если они были отправлены р...
Как увеличить матричные факторы в Spark ALS рекомендует?
Я новичок в мире машинного обучения и использования Apache Spark.Я следовал за учебником вhttps://databricks-training.s3.amazonaws.com/movie-recommendation-w...