El servidor de ahorro HDFS devuelve contenido de FS local, no HDFS
Estoy accediendo a HDFS usando thrift.
Este es el contenido esperado (y correcto) en HDFS.
[hadoop@hdp-namenode-01 ~]$ hadoop fs -ls /
Found 3 items
drwxr-xr-x - hadoop supergroup 0 2012-04-26 14:07 /home
drwxr-xr-x - hadoop supergroup 0 2012-04-26 14:21 /tmp
drwxr-xr-x - hadoop supergroup 0 2012-04-26 14:20 /user
Y luego comienzo un HDFSThriftServer
[hadoop@hdp-namenode-01 ~]$ jps
17290 JobTracker
16980 NameNode
27289 Jps
17190 SecondaryNameNode
17511 RunJar
25270 HadoopThriftServer
Intenta acceder al contenido a través de thrift en PHP.
$transport = new TSocket(HDFS_HOST, HDFS_PORT);
$transport->setRecvTimeout(60000);
$transport->setSendTimeout(60000);
$protocol =new TBinaryProtocol($transport);
$client = new ThriftHadoopFileSystemClient($protocol);
logv("connect hdfs");
$transport->open();
logv("testing existent of `%s'", $remote_uri);
$remote_path = new Pathname(array('pathname' => $remote_uri));
$remote_file = null;
try {
$remote_file = $client->listStatus($remote_path);
} catch(Exception $e) { }
if (!$remote_file)
loge("could not open `%s'", $remote_uri);
Mientras$remote_uri
Es un camino absoluto. por$remote_uri === '/non/existent'
o'/user'
, etc., listStatus siempre falla. Pero si lo cambio a'/tmp'
, Me parece que enumera el contenido de'/tmp'
del FS local del servidor de ahorro.
¡Así que el contenido devuelto es un FS local en el servidor de ahorro en lugar de HDFS! ¿Qué está mal aquí?