Изменение стратегии размещения блоков HDFS
Я хотел бы изменить стратегию размещения блоков HDFS по умолчанию в соответствии с моим приложением.
Например, у меня есть два файла: file1 (128MB) и file2 (128MB). Имея размер блока 64 МБ, каждый из файлов будет разделен на два блока.
Я хочу убедиться, что block1 и file1, и file2 размещены в одной и той же датоде. Если возможно, я также хотел бы убедиться, что реплики также размещены на том же наборе датододов.
Вопрос 1. Возможно ли это? Если да, то какие классы в исходном коде нужно изменить?Вопрос 2. Как такие команды, какcopyFromLocal сопоставлены с функциями в исходном коде hadoop?