Wie wird der Apache-Funke dazu gebracht, Punkte in einer Abfrage zu ignorieren?

Question

Jun 03, 2016, 06:27 PM

Wie wird der Apache-Funke dazu gebracht, Punkte in einer Abfrage zu ignorieren?

Gab die folgende JSON-Datei:

[{"dog*woof":"bad dog 1","dog.woof":"bad dog 32"}]

Warum schlägt dieser Java-Code fehl:

DataFrame df = sqlContext.read().json("dogfile.json");
df.groupBy("dog.woof").count().show();

aber dies nicht:

DataFrame df = sqlContext.read().json("dogfile.json");
df.groupBy("dog*woof").count().show();

Dies ist ein Ausschnitt aus dem Fehler:

 Exception in thread "main" org.apache.spark.sql.AnalysisException: cannot resolve 'dog.woof' given input columns: [dog*woof, dog.woof];
    at org.apache.spark.sql.catalyst.analysis.package$AnalysisErrorAt.failAnalysis(package.scala:42)
    at org.apache.spark.sql.catalyst.analysis.CheckAnalysis$anonfun$checkAnalysis$1$anonfun$apply$2.applyOrElse(CheckAnalysis.scala:60)
    at org.apache.spark.sql.catalyst.analysis.CheckAnalysis$anonfun$checkAnalysis$1$anonfun$apply$2.applyOrElse(CheckAnalysis.scala:57)
    at org.apache.spark.sql.catalyst.trees.TreeNode$anonfun$transformUp$1.apply(TreeNode.scala:335)
    at org.apache.spark.sql.catalyst.trees.TreeNode$anonfun$transformUp$1.apply(TreeNode.scala:335)
    at org.apache.spark.sql.catalyst.trees.CurrentOrigin$.withOrigin(TreeNode.scala:69)
    at org.apache.spark.sql.catalyst.trees.TreeNode.transformUp(TreeNode.scala:334)
...