Результаты поиска по запросу "hive"
использование JSON-SerDe в таблицах Hive
Я пытаюсь JSON-SerDe снизу ссылку http://code.google.com/p/hive-json-serde/wiki/GettingStarted [http://code.google.com/p/hive-json-serde/wiki/GettingStarted]. CREATE TABLE my_table (field1 string, field2 int, field3 string, field4 double) ROW ...
Как я могу выполнить Sqoop в Java?
Я создал новый Java-проект, затем добавил Library Sqoop и Hadoop. (Библиотеки "hadoop-core-1.1.1.jar, sqoop-1.4.2.jar и т. Д ....".) Тогда я попробовал ниже код: public class MySqoopDriver { public static void main(String[] args) { String[] str ...
импортировать сложные данные Json в улей
Требуется небольшая ложка кормления, как импортировать комплекс JSON в улей. JSON файл в формате:{"some-headers":"", "dump":[{"item-id":"item-1"},{"item-id":"item-2"},...]}, Улей, чтобы поля были даны подdump, Размер файла Json, как и сейчас, не ...
Как удалить / усечь таблицы из Hadoop-Hive?
Скажите, пожалуйста, как удалить таблицу из улья, а также укажите, где можно получить дополнительную информацию о запросах улья.
Можно ли импортировать данные в таблицу Hive без копирования данных?
У меня есть файлы журналов, хранящиеся в виде текста в HDFS. Когда я загружаю файлы журнала в таблицу Hive, все файлы копируются. Могу ли я избежать хранения всех моих текстовых данных дважды? РЕДАКТИРОВАТЬ: я загружаю его с помощью следующей ...
Взрыв строки XML-данных в Hive
У нас есть данные XML, загруженные в Hadoop в виде единого строкового столбца с именем XML. Мы пытаемся восстановить до уровня данных нормализовать или разбить их на отдельные строки для обработки (вы знаете, как таблицу!). Мы пытались выполнить ...
Запросы зависают при использовании Hiveserver2 Thrift Java client
Это дополнительный вопрос кэтот вопрос [https://stackoverflow.com/questions/15372388/hiveserver2-java-api]где я спрашиваю, что такое Java-клиент Hiveserver 2 thrift. Этот вопрос должен быть в состоянии стоять без этого фона, если вам не нужно ...
Добавить несколько файлов в распределенный кеш в HIVE
В настоящее время у меня возникла проблема с добавлением содержимого папок в доверенный кеш Hives. Я могу успешно добавить несколько файлов в распределенный кеш в Hive, используя: ADD FILE /folder/file1.ext; ADD FILE /folder/file2.ext; ADD ...
java.lang.OutOfMemoryError: невозможно создать новый собственный поток для большого набора данных
У меня запущен запрос улья, который отлично работает для небольшого набора данных. но я бегу за 250 миллионов записей, у меня есть ошибки ниже в журналах FATAL org.apache.hadoop.mapred.Child: Error running child : java.lang.OutOfMemoryError: ...
Улей: как показать все разделы таблицы?
У меня есть таблица с 1000+ разделов. "Show partitionsmsgstr "команда выводит только небольшое количество разделов. Как я могу показать все разделы? Обновить: Я нашел "show partitionsmsgstr "команда перечисляет только 500 разделов. "select ...