Результаты поиска по запросу "hadoop"

6 ответов

Есть ли эквивалент в `pwd` в hdfs?

11 ответов

Вставка данных в таблицу кустов

Я новичок в улье. Я успешно настроил кластер Hadoop с одним узлом для целей разработки, и поверх него я установил Hive и Pig. Я создал фиктивную таблицу в у...

3 ответа

Отказ от соединения через порт 9000

Я хочу настроить hadoop-кластер в псевдораспределенном режиме для разработки. Попытка запустить кластер hadoop не удалась из-за отказа в соединении через порт 9000. Это мои конфиги (довольно стандартные): Сайт-core.xml: <?xml version="1.0"?> ...

ТОП публикаций

3 ответа

Свинья и Кассандра и DataStax разделение контроля

Я использовал Pig со своими данными Cassandra, чтобы совершать всевозможные удивительные подвиги группировок, которые было бы практически невозможно написать настоятельно. Я использую интеграцию DataStax с Hadoop & Cassandra, и должен сказать, ...

1 ответ

Hadoop: простой способ иметь объект в качестве выходного значения без интерфейса записи

Я пытаюсь использовать hadoop для обучения нескольких моделей. Мои данные достаточно малы, чтобы поместиться в памяти, поэтому я хочу обучить одну модель для каждой задачи карты. Моя проблема в том, что когда я закончу тренировать свою модель, ...

3 ответа

Где находится исходный код для примеров Apache Hadoop

Может кто-нибудь, пожалуйста, направьте меня к исходному коду для примеров Apache Hadoop Yarn. Дистрибутив 2.2.0 поставляется с jar names hadoop-mapreduce-examples-2.2.0.jar. Я пытаюсь найти исходный код для примеров. Любой указатель будет ...

2 ответа

Hbase Schema Nested Entity

У кого-нибудь есть пример того, как создать таблицу Hbase с вложенной сущностью?пример

4 ответа

Как написать 'map only' задания hadoop?

Я новичок в Hadoop, я знакомлюсь со стилем программирования Map-Reduce, но теперь я столкнулся с проблемой: иногда мне нужно только карта для работы, и мне нужен только результат карты непосредственно в качестве вывода, что означает уменьшение ...

4 ответа

Сравнение Hadoop с RDBMS

Я действительно не понимаю истинную причину масштабирования Hadoop лучше, чем RDBMS. Кто-нибудь может объяснить, пожалуйста, на детальном уровне? Это как-то ...

3 ответа

Запуск режима Apache Spark YARN занимает слишком много времени (10+ секунд)