Полное использование всех ядер в псевдораспределенном режиме Hadoop
Я запускаю задачу в псевдораспределенном режиме на своем 4-ядерном ноутбуке. Как я могу обеспечить эффективное использование всех ядер? В настоящее время мой трекер работы показывает, что одновременно выполняется только одна работа. Означает ли это, что используется только одно ядро?
Ниже приведены мои файлы конфигурации.
конф / ядро-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
конф / HDFS-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
конф / mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
РЕДАКТИРОВАТЬ: Согласно ответу, мне нужно добавить следующие свойства в mapred-site.xml
<property>
<name>mapred.map.tasks</name>
<value>4</value>
</property>
<property>
<name>mapred.reduce.tasks</name>
<value>4</value>
</property>