Es werden 0 Datenknoten ausgeführt, und in dieser Operation werden keine Knoten ausgeschlossen.

Ich habe einen Hadoop-Cluster mit mehreren Knoten eingerichtet. Der NameNode und der Secondary-NameNode werden auf demselben Computer ausgeführt, und der Cluster verfügt nur über einen Datenknoten. Alle Knoten sind auf Amazon EC2-Computern konfiguriert.

Es folgen die Konfigurationsdateien auf dem Masterknoten:
masters
54.68.218.192 (public IP of the master node)

slaves
54.68.169.62 (public IP of the slave node)

core-site.xml

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/datanode</value>
</property>
</configuration>
Nun sind die Konfigurationsdateien auf dem Datenknoten:

core-site.xml

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://54.68.218.192:10001</value>
</property>
</configuration>

mapred-site.xml

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>54.68.218.192:10002</value>
</property>
</configuration>

hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/datanode</value>
</property>
</configuration>

die auf dem Namenode laufenden jps geben folgendes an:

5696 NameNode
6504 Jps
5905 SecondaryNameNode
6040 ResourceManager

und jps auf datanode:

2883 DataNode
3496 Jps
3381 NodeManager

was mir richtig erscheint.

Nun, wenn ich versuche, einen put-Befehl auszuführen:

hadoop fs -put count_inputfile /test/input/

Es gibt mir den folgenden Fehler:

put: File /count_inputfile._COPYING_ could only be replicated to 0 nodes instead of minReplication (=1).  There are 0 datanode(s) running and no node(s) are excluded in this operation.

Die Protokolle auf dem Datenknoten sagen Folgendes:

hadoop-datanode log
INFO org.apache.hadoop.ipc.Client: Retrying connect to server:      54.68.218.192/54.68.218.192:10001. Already tried 8 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

Garn-Knoten-Manager-Protokoll:

INFO org.apache.hadoop.ipc.Client: Retrying connect to server: 0.0.0.0/0.0.0.0:8031. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

Die Web-Benutzeroberfläche von Node Manager (50070) zeigt, dass 0 aktive Knoten und 0 tote Knoten vorhanden sind und die verwendete DFS 100% @ beträg

Ich habe auch IPV6 deaktiviert.

uf ein paar Webseiten habe ich herausgefunden, dass ich auch das @ bearbeiten so/etc/hosts Datei. Ich habe sie auch bearbeitet und sie sehen so aus:

127.0.0.1 localhost
172.31.25.151 ip-172-31-25-151.us-west-2.compute.internal
172.31.25.152 ip-172-31-25-152.us-west-2.compute.internal

Warum erhalte ich immer noch den Fehler?

Antworten auf die Frage(11)

Ihre Antwort auf die Frage