Como ler dados do Cassandra com R?
Estou usando o R 2.14.1 e o Cassandra 1.2.11, tenho um programa separado que gravou dados em uma única tabela do Cassandra. Não estou conseguindo lê-los de R.
O esquema Cassandra é definido assim:
create table chosen_samples (id bigint , temperature double, primary key(id))
Eu tentei primeiro o pacote RCassandra (http://www.rforge.net/RCassandra/)
> # install.packages("RCassandra")
> library(RCassandra)
> rc <- RC.connect(host ="192.168.33.10", port = 9160L)
> RC.use(rc, "poc1_samples")
> cs <- RC.read.table(rc, c.family="chosen_samples")
A conexão parece ter êxito, mas a análise da tabela no quadro de dados falha:
> cs
Error in data.frame(..dfd. = c("@\"ffffff", "@(<cc><cc><cc><cc><cc><cd>", :
duplicate row.names:
Eu também tentei usar o conector JDBC, conforme descrito aqui:http://www.datastax.com/dev/blog/big-analytics-with-r-cassandra-and-hive
> # install.packages("RJDBC")
> library(RJDBC)
> cassdrv <- JDBC("org.apache.cassandra.cql.jdbc.CassandraDriver", "/Users/svend/dev/libs/cassandra-jdbc-1.2.5.jar", "`")
Mas este falha assim:
Error in .jfindClass(as.character(driverClass)[1]) : class not found
Mesmo que o local para o driver java esteja correto
$ ls /Users/svend/dev/libs/cassandra-jdbc-1.2.5.jar
/Users/svend/dev/libs/cassandra-jdbc-1.2.5.jar