Результаты поиска по запросу "hdfs"

2 ответа

Как перечислить файлы в директории HDFS

Как мне перечислить файлы в каталоге HDFS? Это для перечисления файлов в кластере Apache Spark с использованием Scala. Я вижу, что есть опция sc.textfile (),...

1 ответ

PySpark: чтение, отображение и сокращение из многострочного текстового файла записи с новым APIHadoopFile

Я пытаюсь решить проблему, похожую наэта почта, Мои исходные данные - это текстовый файл, который содержит значения (наблюдения) нескольких датчиков. Каждое ...

4 ответа

Добавление разделенной запятыми таблицы в Hive

У меня очень простой вопрос: как мне добавить очень простую таблицу в Hive. Моя таблица сохраняется в текстовом файле (.txt), который сохраняется в HDFS. Я п...

ТОП публикаций

1 ответ

Spark: сохранение RDD по уже существующему пути в HDFS

Я могу сохранить вывод RDD в HDFS сsaveAsTextFile метод. Этот метод вызывает исключение, если путь к файлу уже существует.У меня есть случай, когда мне нужно...

1 ответ

Искра нужна HDFS

Привет, кто-нибудь может мне объяснить, нужна ли Apache 'Spark Standalone' HDFS?Если требуется, как Spark использует размер блока HDFS во время выпол...

2 ответа

Получить файлы, которые были созданы за последние 5 минут в hadoop, используя скрипт оболочки

У меня есть файлы в HDFS как:

2 ответа

Как я могу сохранить RDD в HDFS и позже прочитать его обратно?

0 ответов

Корневая директория: / tmp / hive на HDFS должна быть доступна для записи. Текущие разрешения: -wx ------

3 ответа

Отказ от соединения через порт 9000

Я хочу настроить hadoop-кластер в псевдораспределенном режиме для разработки. Попытка запустить кластер hadoop не удалась из-за отказа в соединении через порт 9000. Это мои конфиги (довольно стандартные): Сайт-core.xml: <?xml version="1.0"?> ...

2 ответа

Вы можете скопировать сервер ключей на свой рабочий стол, вы должны загрузить с помощью kinit и проверить с помощью klist