Результаты поиска по запросу "hadoop"
Сравнение Hadoop с RDBMS
Я действительно не понимаю истинную причину масштабирования Hadoop лучше, чем RDBMS. Кто-нибудь может объяснить, пожалуйста, на детальном уровне? Это как-то ...
Hadoop 1.2.1 - многоузловой кластер - фаза редуктора зависает для программы Wordcount?
Мой вопрос может показаться излишним, но решение предыдущих вопросов было специальным. мало что пробовал но пока не повезлоНа самом деле, я работаю над hadoo...
Как посчитать строки в файле по команде hdfs?
У меня есть файл на HDFS, который я хочу знать, сколько строк. (TestFile)В Linux я могу сделать:
Будет ли Spark бездействовать сам RDD, когда он поймет, что он больше не будет использоваться?
Мы можем сохранить СДР в памяти и / или на диске, когда хотим использовать его более одного раза. Тем не менее, нужно ли нам в дальнейшем самим отменять это,...
Как сохранить файлы журнала YARN?
Внезапно мой кластер YARN перестал работать, все, что я отправляю, завершается с ошибкой «Код выхода 1». Я хочу отследить эту проблему, но как только приложе...
Почему спарк-оболочка не работает с NullPointerException?
Я пытаюсь выполнить
Где синтаксическая ошибка в этом простом запросе Hive со STRUCT?
Давайте импортируем простую таблицу в Hive:
Hadoop - требуется помощь для понимания шагов обработки
У меня есть сжатый файл, и он содержит 8 файлов XML размером 5-10 КБ. Я взял эти данные для тестирования. Я написал одну программу только для карт, чтобы рас...
Как можно перечислить все CSV-файлы в папке HDFS в оболочке Spark Scala?
Цель этого состоит в том, чтобы манипулировать и сохранять копию каждого файла данных во втором местоположении в HDFS. Я буду использовать
Hive: приведение массива <string> к массиву <int> в запросе
У меня есть две таблицы: