Изменение стратегии размещения блоков HDFS

Я хотел бы изменить стратегию размещения блоков HDFS по умолчанию в соответствии с моим приложением.

Например, у меня есть два файла: file1 (128MB) и file2 (128MB). Имея размер блока 64 МБ, каждый из файлов будет разделен на два блока.

Я хочу убедиться, что block1 и file1, и file2 размещены в одной и той же датоде. Если возможно, я также хотел бы убедиться, что реплики также размещены на том же наборе датододов.

Вопрос 1. Возможно ли это? Если да, то какие классы в исходном коде нужно изменить?



Вопрос 2. Как такие команды, какcopyFromLocal сопоставлены с функциями в исходном коде hadoop?

Ответы на вопрос(1)

Ваш ответ на вопрос