Результаты поиска по запросу "hive"

1 ответ

Улей и регулярное выражение

Я пытаюсь отфильтровать все IP-адреса в имени пользователя. Но это действительно не работает должным образом в моем запросе: select distinct regexp_extract(username, '^([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})$', 0) from ...

1 ответ

Даже если мы изменим местоположение, таблица будет вести себя только как управляемая таблица

е, можем ли мы изменить расположение управляемой / внешней таблицы, если да, то как. После изменения местоположения будет вести себя как внешняя таблица или внутренняя таблица

1 ответ

Эти сложные демонстрации настолько ясны, чтобы знать, как написать внутреннее соединение и левое соединение. Огромное спасибо!

оединиться к документациипоскольку Hive поощряет использование неявных объединений, т.е. [https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins]Это эквивалентно SELECT * FROM table1 t1, table2 t2, table3 t3 WHERE t1.id = t2.id ...

ТОП публикаций

1 ответ

Вот пример запроса Hive, который я выполняю. Вы можете видеть здесь 2 броска:

аюсь создать своего рода конвейер данных для переноса моих таблиц Hive в BigQuery. Hive работает на кластере Hadoop. Это мой текущий дизайн, на самом деле, это очень просто, это всего лишь сценарий оболочки: для каждой таблицы source_hive_table ...

1 ответ

 в

я выполняю следующий запрос, я получаю только один файл, хотя у меня есть 8 картографов и 0 редукторов. create table table_2 as select * from table_1.Вызывается 8 картографов, и фаза редуктора отсутствует. В таблице table_2 находится только ...

1 ответ

@ayushnigam Я изменил свой ответ на основе вашего ответа.

аюсь подключиться к Hive-Server2 через JDBC. Сервер включен Kerberos. Я использую следующий код, я запускаю код пограничного узла, где присутствует файл keytab Чего мне не хватает? import org.apache.hadoop.security.UserGroupInformation; public ...

1 ответ

 определить ключи для разделения данных.

я есть пакетное задание, которое выполняется ежечасно. Каждый прогон генерирует и сохраняет новые данные вS3 с шаблоном именования каталоговDATA/YEAR=?/MONTH=?/DATE=?/datafile. После загрузки данных вS3Я хочу исследовать их, используяAthena, ...

2 ответа

@shrewquest - Обновлен ответ методом 2, который не требует изменений в ваших данных. надеюсь это поможет!

аюсь импортировать данные в следующем формате в таблицу кустов [ { "identifier" : "id#1", "dataA" : "dataA#1" }, { "identifier" : "id#2", "dataA" : "dataA#2" } ]У меня есть несколько таких файлов, и я хочу, чтобы каждый {} формировал одну строку ...

2 ответа

Пропустить первую строку CSV при загрузке в таблице улья

Здравствуйте друзья, Я создал таблицу в улье с помощью следующей команды - CREATE TABLE db.test ( fname STRING, lname STRING, age STRING, mob BIGINT ) row format delimited fields terminated BY '\t' stored AS textfile;Теперь, чтобы загрузить ...

1 ответ

 пожалуйста, посмотрите. извините за путаницу

ользую Hive Metastore в EMR. Я могу запросить таблицу вручную через HiveSQL. Но когда я использую ту же таблицу в Spark Job, он говоритВходной путь не существует: s3: // Вызывается: org.apache.hadoop.mapred.InvalidInputException: Входной путь ...