Driver Cassandra Datatax lançando CodecNotFoundException

A exceção exata é a seguinte

com.datastax.driver.core.exceptions.CodecNotFoundException: codec não encontrado para a operação solicitada: [varchar <-> java.math.BigDecimal]

Estas são as versões do software que estou usando Spark 1.5 Datastax-cassandra 3.2.1 CDH 5.5.1

O código que estou tentando executar é um programa Spark usando a API Java e basicamente lê dados (csv) de hdfs e os carrega nas tabelas cassandra. Estou usando o conector spark-cassandra. Inicialmente, tive muitos problemas com relação ao conflito da biblioteca de goiabas do google que consegui resolver sombreando a biblioteca de goiabeiras e criando um jar instantâneo com todas as dependências.

No entanto, consegui carregar dados para alguns arquivos, mas para alguns arquivos recebo a exceção de codec. Quando pesquisei sobre esse problema, recebi os seguintes tópicos sobre o mesmo problema.

https://groups.google.com/a/lists.datastax.com/forum/#!topic/java-driver-user/yZyaOQ-wazk

https://groups.google.com/a/lists.datastax.com/forum/#!topic/java-driver-user/yZyaOQ-wazk

Depois de passar por essas discussões, o que eu entendo é que é uma versão errada do driver de cassandra que estou usando. Ou ainda há um problema de caminho de classe relacionado à biblioteca de goiaba, pois o cassandra 3.0 e versões posteriores usam o goia 16.0.1 e as discussões acima dizem que pode haver uma versão inferior da goiaba presente no caminho de classe.

Aqui está o arquivo pom.xml

 <dependencies>
 <dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.10</artifactId>
<version>1.5.0</version> 
</dependency>
<dependency>
  <groupId>junit</groupId>
  <artifactId>junit</artifactId>
  <version>3.8.1</version>
  <scope>test</scope>
</dependency>
<dependency>
<groupId>com.datastax.spark</groupId>
<artifactId>spark-cassandra-connector-java_2.10</artifactId>
<version>1.5.0-M3</version>
</dependency>
<dependency>
<groupId>org.apache.cassandra</groupId>
<artifactId>cassandra-clientutil</artifactId>
<version>3.2.1</version>
</dependency>

</dependencies>
  <build>
<plugins>
    <plugin>
        <groupId>org.apache.maven.plugins</groupId>
        <artifactId>maven-shade-plugin</artifactId>
        <version>2.3</version>
        <executions>
            <execution>
                <phase>package</phase>
                <goals>
                    <goal>shade</goal>
                </goals>
                <configuration>
                 <filters>
    <filter>
        <artifact>*:*</artifact>
        <excludes>
            <exclude>META-INF/*.SF</exclude>
            <exclude>META-INF/*.DSA</exclude>
            <exclude>META-INF/*.RSA</exclude>
        </excludes>
    </filter>
</filters>
                    <relocations>
                        <relocation>
                            <pattern>com.google</pattern>
                            <shadedPattern>com.pointcross.shaded.google</shadedPattern>
                        </relocation>

                    </relocations>
                    <minimizeJar>false</minimizeJar>
                    <shadedArtifactAttached>true</shadedArtifactAttached>
                </configuration>
            </execution>
        </executions>
    </plugin>
</plugins>
</build>
</project>

e estas são as dependências que foram baixadas usando o pom acima

spark-core_2.10-1.5.0.jar
spark-cassandra-connector-   java_2.10-1.5.0-M3.jar
spark-cassandra-connector_2.10-1.5.0-M3.jar
spark-repl_2.10-1.5.1.jar
spark-bagel_2.10-1.5.1.jar
spark-mllib_2.10-1.5.1.jar
spark-streaming_2.10-1.5.1.jar
spark-graphx_2.10-1.5.1.jar
guava-16.0.1.jar
cassandra-clientutil-3.2.1.jar
cassandra-driver-core-3.0.0-alpha4.jar

Acima estão algumas das principais dependências do meu jar instantâneo.

Y é o CodecNotFoundException? É por causa do caminho da classe (goiaba)? ou cassandra-driver (cassandra-driver-core-3.0.0-alpha4.jar para datastax cassandra 3.2.1) ou por causa do código.

Outro ponto é todas as datas que estou inserindo nas colunas cujo tipo de dados é o registro de data e hora.

Além disso, quando faço o envio de faísca, vejo o caminho da classe nos logs. Existem outras versões da goiaba que estão sob as bibliotecas do hadoop. R estes causando o problema?

Como especificamos o caminho de uma classe específica do usuário enquanto fazemos um envio de spark. Isso vai ajudar?

Ficaria feliz em obter alguns pontos sobre estes. obrigado

A seguir é apresentado o stacktrace

com.datastax.driver.core.exceptions.CodecNotFoundException: Codec not found for requested operation: [timestamp <-> java.lang.String]
at com.datastax.driver.core.CodecRegistry.notFound(CodecRegistry.java:689)
at com.datastax.driver.core.CodecRegistry.createCodec(CodecRegistry.java:550)
at com.datastax.driver.core.CodecRegistry.findCodec(CodecRegistry.java:530)
at com.datastax.driver.core.CodecRegistry.codecFor(CodecRegistry.java:485)
at com.datastax.driver.core.AbstractGettableByIndexData.codecFor(AbstractGettableByIndexData.java:85)
at com.datastax.driver.core.BoundStatement.bind(BoundStatement.java:198)
at com.datastax.driver.core.DefaultPreparedStatement.bind(DefaultPreparedStatement.java:126)
at com.cassandra.test.LoadDataToCassandra$1.call(LoadDataToCassandra.java:223)
at com.cassandra.test.LoadDataToCassandra$1.call(LoadDataToCassandra.java:1)
at org.apache.spark.api.java.JavaPairRDD$anonfun$toScalaFunction$1.apply(JavaPairRDD.scala:1027)
at scala.collection.Iterator$anon$11.next(Iterator.scala:328)
at org.apache.spark.util.Utils$.getIteratorSize(Utils.scala:1555)
at org.apache.spark.rdd.RDD$anonfun$count$1.apply(RDD.scala:1121)
at org.apache.spark.rdd.RDD$anonfun$count$1.apply(RDD.scala:1121)
at org.apache.spark.SparkContext$anonfun$runJob$5.apply(SparkContext.scala:1850)
at org.apache.spark.SparkContext$anonfun$runJob$5.apply(SparkContext.scala:1850)
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:66)
at org.apache.spark.scheduler.Task.run(Task.scala:88)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:214)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)

Eu também tenho

com.datastax.driver.core.exceptions.CodecNotFoundException: Codec not found for requested operation: [Math.BigDecimal <-> java.lang.String]

questionAnswers(2)

yourAnswerToTheQuestion