Результаты поиска по запросу "hadoop"

исал запрос, чтобы найти 10 самых загруженных аэропортов в США с марта по апрель. Это дает желаемый результат, однако я хочу попытаться оптимизировать его. Есть ли какие-либо специфичные для HiveQL оптимизации, которые можно применить ...

jar apache-pig java

6 ответов

-files Аргумент files используется для распространения файлов через Hadoop Distributed Cache. В приведенном выше примере мы распространяем файл данных Max Mind Geo-IP через распределенный кэш Hadoop. Нам необходим доступ к файлу гео-IP-адресов Max Mind, чтобы сопоставить IP-адрес пользователя с соответствующей страной, регионом, городом и часовым поясом. API требует, чтобы файл данных присутствовал локально, что невозможно в распределенной среде обработки (нам не будет гарантировано, какие узлы в кластере будут обрабатывать данные). Для распространения соответствующих данных на узел обработки мы используем инфраструктуру распределенного кэша Hadoop. GenericOptionsParser и ToolRunner автоматически облегчают это, используя аргумент –file. Обратите внимание, что файл, который мы распространяем, должен быть доступен в облаке (HDFS). -libjars –libjars используется для распространения любых дополнительных зависимостей, необходимых для заданий map-Reduce. Как и файл данных, нам также необходимо скопировать зависимые библиотеки в узлы кластера, где будет выполняться задание. GenericOptionsParser и ToolRunner автоматически облегчают это, используя аргумент –libjars.

кст этого вопроса заключается в том, что я пытаюсь использовать Java Java API maxmind в сценарии свиньи, который я написал ... Однако я не думаю, что знание того или другого необходимо для ответа на вопрос. API maxmind имеет конструктор, который ...

cloudera hdfs

2 ответа

Установка fs.default.name в core-site.xml Устанавливает HDFS в безопасный режим

Я установил дистрибутив Cloudera CDH4 на одной машине в псевдораспределенном режиме и успешно проверил, что он работает правильно (например, может запускать программы MapReduce, вставлять данные на сервер Hive и т. Д.). Однако, если ...

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

hive

1 ответ

перешел в чат

чение улья [https://i.stack.imgur.com/wfhIV.png] Я установил Hadoop 3.0.0 и Hive 2.3.1 на свой компьютер. Параллельно я установил MySQL и работал с командами SQL в режиме оболочки SQL и работает нормально. Но при выполнении запросов в режиме ...

amazon-emr mapreduce

0 ответов

Тогда все просто работает. Вам не нужно (а может и не нужно) менять

аюсь поиграть с набором данных Google Ngrams, используя Amazon Elastic Map Reduce. Есть публичный набор данных на http://aws.amazon.com/datasets/8172056142375670 [http://aws.amazon.com/datasets/8172056142375670]и я хочу использовать ...

java

1 ответ

Как преобразовать объект String в объект IntWritable в Hadoop

Я хочу конвертироватьString ВозражатьIntWritable Объект в Hadoop. любой процесс доступен для преобразования. Спасибо

windows

2 ответа

Документация по установке и запуску hadoop 2.2 в Windows

В последней версии Hadoop 2.2 я вижу, что в примечаниях к выпуску упоминается, что эта версия имеет значительные улучшения для запуска Hadoop в Windows. Вчера я скачал Hadoop 2.2 и увидел множество файлов .cmd с файлами .sh, что гарантирует ...

cloudera hive

1 ответ

Hive не полностью соблюдает значение fs.default.name/fs.defaultFS в core-site.xml

У меня установлена служба NameNode на компьютере с именемhadoop. core-site.xml файл имеетfs.defaultFS (эквивалентноfs.default.name) установите следующее: <property> <name>fs.defaultFS</name> <value>hdfs://hadoop:8020</value> </property>У меня ...

yarn apache-spark scala

0 ответов

Опять же, есть ли отдельные исполнители, выполняющие больше работы, чем другие?

аю строку длиной более 100 Кбайт и разделяю столбцы по ширине. У меня есть около 16K столбцов, которые я разделил сверху строки на основе ширины. но при записи в паркет я использую код ниже rdd1=spark.sparkContext.textfile("file1") { var now=0 ...

hdfs apache-spark

1 ответ

паркет без формата

ользуюИскровым Java. Мне нужно знать, есть ли разница (производительность и т. Д.) Между следующими методами записи в Hadoop: ds.write().mode(mode).format("orc").save(path);Или же ds.write().mode(mode).orc(path);Благодарю.

Страница 90 из 116

88 899091 92

Результаты поиска по запросу "hadoop"

и фильтровать аэропорт по

Установка fs.default.name в core-site.xml Устанавливает HDFS в безопасный режим

Популярные теги

ТОП публикаций

перешел в чат

Тогда все просто работает. Вам не нужно (а может и не нужно) менять

Как преобразовать объект String в объект IntWritable в Hadoop

Документация по установке и запуску hadoop 2.2 в Windows

Hive не полностью соблюдает значение fs.default.name/fs.defaultFS в core-site.xml

Опять же, есть ли отдельные исполнители, выполняющие больше работы, чем другие?

паркет без формата

Вы очень активны! Это здорово!

Результаты поиска по запросу "hadoop"

Популярные теги

ТОП публикаций