Результаты поиска по запросу "hadoop"

1 ответ

Mahout строкаСходство

Я пытаюсь вычислить сходство строк между документами Википедии. У меня есть векторы TF-IDF в форматеKey class: class org.apache.hadoop.io.Text Value Class: class org.apache.mahout.math.VectorWritable, Я следую за быстрым туром анализа текста ...

6 ответов

В чем разница между командами оболочки «hadoop fs» и командами оболочки «hdfs dfs»?

Они должны быть равны? но почемуhadoop fs«Команды показываютhdfs files в то время как "hdfs dfs"команды показывают локальные файлы? Вот информация о версии Hadoop: Hadoop 2.0.0-mr1-cdh4.2.1. Subversion ...

3 ответа

Просто получите имена столбцов из таблицы улья

Я знаю, что вы можете получить имена столбцов из таблицы с помощью следующего трюка в улье:

ТОП публикаций

3 ответа

Hadoop не может подключиться к Google Cloud Storage

Я пытаюсь подключить Hadoop, работающий на Google Cloud VM, к Google Cloud Storage. Я имею:Изменен файл core-site.xml для включения свойств fs.gs.impl и fs.A...

1 ответ

Hadoop Map Reduce для чтения текстового файла

Я пытаюсь написать программу MapReduce, которая может прочитать входной файл и записать вывод в другой текстовый файл. Я планирую использовать для этого клас...

1 ответ

Сборка Apache Pig для версии Hadoop 2.4

Я скачал PIG 0.14 и сделалмуравейник -dhadoopversion = 23 банка , но когда я использовал его на Hadoop 2.4, он не работает. Есть ли что-то, что я должен сдел...

1 ответ

Spark SQL не может завершить запись данных Parquet с большим количеством фрагментов

Я пытаюсь использовать Apache Spark SQL для преобразования данных журнала JSON на S3 в файлы Parquet также на S3. Мой код в основном:

3 ответа

обработка символа новой строки в улье

Я создал таблицу в улье, как

4 ответа

Как преобразовать строку в метку времени с миллисекундами в Hive

У меня есть строка «20141014123456789», которая представляет метку времени с миллисекундами, которую мне нужно преобразовать в метку времени в кусте (0.13.0)...

1 ответ

Столы Hiveing ​​в свечах

Я установил Hive 0.13 и создал пользовательские базы данных. У меня спарк 1.1.0 кластер с одним узлом построен с использованием опции mvn -hive. Я хочу получ...