Результаты поиска по запросу "hadoop"

4 ответа

Сравнение Hadoop с RDBMS

Я действительно не понимаю истинную причину масштабирования Hadoop лучше, чем RDBMS. Кто-нибудь может объяснить, пожалуйста, на детальном уровне? Это как-то ...

1 ответ

Hadoop 1.2.1 - многоузловой кластер - фаза редуктора зависает для программы Wordcount?

Мой вопрос может показаться излишним, но решение предыдущих вопросов было специальным. мало что пробовал но пока не повезлоНа самом деле, я работаю над hadoo...

3 ответа

Как посчитать строки в файле по команде hdfs?

У меня есть файл на HDFS, который я хочу знать, сколько строк. (TestFile)В Linux я могу сделать:

ТОП публикаций

2 ответа

Будет ли Spark бездействовать сам RDD, когда он поймет, что он больше не будет использоваться?

Мы можем сохранить СДР в памяти и / или на диске, когда хотим использовать его более одного раза. Тем не менее, нужно ли нам в дальнейшем самим отменять это,...

1 ответ

Как сохранить файлы журнала YARN?

Внезапно мой кластер YARN перестал работать, все, что я отправляю, завершается с ошибкой «Код выхода 1». Я хочу отследить эту проблему, но как только приложе...

10 ответов

Почему спарк-оболочка не работает с NullPointerException?

Я пытаюсь выполнить

1 ответ

Где синтаксическая ошибка в этом простом запросе Hive со STRUCT?

Давайте импортируем простую таблицу в Hive:

1 ответ

Hadoop - требуется помощь для понимания шагов обработки

У меня есть сжатый файл, и он содержит 8 файлов XML размером 5-10 КБ. Я взял эти данные для тестирования. Я написал одну программу только для карт, чтобы рас...

3 ответа

Как можно перечислить все CSV-файлы в папке HDFS в оболочке Spark Scala?

Цель этого состоит в том, чтобы манипулировать и сохранять копию каждого файла данных во втором местоположении в HDFS. Я буду использовать

2 ответа

Hive: приведение массива <string> к массиву <int> в запросе

У меня есть две таблицы: