Результаты поиска по запросу "bigdata"
Очередь заданий для Hive action в oozie
У меня рабочий процесс. Я отправляю все действия улья с
Будет ли Spark бездействовать сам RDD, когда он поймет, что он больше не будет использоваться?
Мы можем сохранить СДР в памяти и / или на диске, когда хотим использовать его более одного раза. Тем не менее, нужно ли нам в дальнейшем самим отменять это,...
Почему Кафка так быстро [закрыто]
Если у меня такое же оборудование, чтобы использовать Kafka или наше текущее решение (ServiceMix / Camel). Есть ли разница? Может ли Кафка обрабатывать «боль...
Эффективно расширяйте цифровую маску на n ячеек вправо для каждого плохого значения
Допустим, у меня есть массив длиной 30 с 4 неверными значениями. Я хочу создать маску для этих плохих значений, но так как я буду использовать функции скольз...
Искра Тип данных Угадай UDAF
Хотел взять что то подобноеhttps://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java и создайте Hive UDAF для создания агрегатной функции,...
PySpark DataFrames - способ перечисления без преобразования в панды?
У меня очень большойpyspark.sql.dataframe.DataFrame по имени дф. Мне нужен какой-то способ перечисления записей - таким образом, возможность доступа к записи...
Как установить размер блока данных в Hadoop? Это преимущество, чтобы изменить это?
Если мы можем изменить размер блока данных в Hadoop, пожалуйста, дайте мне знать, как это сделать. Выгодно ли менять размер блока? Если да, то дайте мне знат...