Результаты поиска по запросу "amazon-emr"
YUM_RSRC_DIR предназначен для указания места, где вы настраиваете входные файлы, необходимые для запуска сценариев. Смотрите шаг 4, он описывает шаблон каталога для файлов ресурсов.
я есть необходимость запустить приложение, которое требует графический интерфейс для запуска и настройки. Мне также нужно иметь возможность запускать это приложение на сервисах Amazon EC2 и EMR. Требование EMR означает, что он должен работать на ...
) полностью пропустив все промежуточные этапы.
я есть EMR-кластер на одной машине c3.8xlarge. После прочтения нескольких ресурсов я понял, что мне нужно разрешить приличный объем памяти вне кучи, потому что я использую pyspark, поэтому я настроил кластер следующим образом: Один ...
Тогда все просто работает. Вам не нужно (а может и не нужно) менять
аюсь поиграть с набором данных Google Ngrams, используя Amazon Elastic Map Reduce. Есть публичный набор данных на http://aws.amazon.com/datasets/8172056142375670 [http://aws.amazon.com/datasets/8172056142375670]и я хочу использовать ...
Показано, что число данных в кадре равно 4067
ботаем спарк 2.3.0 наAWW EMR, ПоследующийDataFrame "df"не пустой и скромного размера: scala> df.count res0: Long = 4067Следующий код хорошо работает для записиdf вhdfs: scala> val hdf = spark.read.parquet("/tmp/topVendors") ...
, И я могу найти его без тегов, а затем применить теги для дальнейшего использования. Спасибо!
у автоматизировать работу кластера и могу использовать теги для получения атрибутов экземпляра EC2, таких как его идентификатор экземпляра. Документация ...
Знает ли главный узел EMR свой идентификатор кластера?
Я хочу иметь возможность создавать кластеры EMR и отправлять сообщения в какую-то центральную очередь для этих кластеров. Чтобы это работало, мне нужно, чтобы какой-то агент работал на каждом главном узле. Каждый из этих агентов должен будет ...
Надеюсь, что это может помочь вам.
аюсь выполнить 2 шага одновременно в EMR. Однако я всегда выполняю первый шаг и второй ожидающий. Часть моей конфигурации пряжи выглядит следующим образом: { "Classification": "capacity-scheduler", "Properties": ...
https://github.com/minrk/findspark
ользую spark over emr и пишу скрипт pyspark, я получаю сообщение об ошибке при попытке from pyspark import SparkContext sc = SparkContext()это ошибка File "pyex.py", line 5, in <module> sc = SparkContext() ...
Папка не удаляется на Amazon S3
Я пытаюсь удалить папку, созданную в результате задания MapReduce. Другие файлы в корзине удаляются просто отлично, но эта папка не удаляется. Когда я пытаюсь удалить его из консоли, индикатор выполнения рядом с его статусом просто остается ...