Wie wird der Apache-Funke dazu gebracht, Punkte in einer Abfrage zu ignorieren?
Gab die folgende JSON-Datei:
[{"dog*woof":"bad dog 1","dog.woof":"bad dog 32"}]
Warum schlägt dieser Java-Code fehl:
DataFrame df = sqlContext.read().json("dogfile.json");
df.groupBy("dog.woof").count().show();
aber dies nicht:
DataFrame df = sqlContext.read().json("dogfile.json");
df.groupBy("dog*woof").count().show();
Dies ist ein Ausschnitt aus dem Fehler:
Exception in thread "main" org.apache.spark.sql.AnalysisException: cannot resolve 'dog.woof' given input columns: [dog*woof, dog.woof];
at org.apache.spark.sql.catalyst.analysis.package$AnalysisErrorAt.failAnalysis(package.scala:42)
at org.apache.spark.sql.catalyst.analysis.CheckAnalysis$anonfun$checkAnalysis$1$anonfun$apply$2.applyOrElse(CheckAnalysis.scala:60)
at org.apache.spark.sql.catalyst.analysis.CheckAnalysis$anonfun$checkAnalysis$1$anonfun$apply$2.applyOrElse(CheckAnalysis.scala:57)
at org.apache.spark.sql.catalyst.trees.TreeNode$anonfun$transformUp$1.apply(TreeNode.scala:335)
at org.apache.spark.sql.catalyst.trees.TreeNode$anonfun$transformUp$1.apply(TreeNode.scala:335)
at org.apache.spark.sql.catalyst.trees.CurrentOrigin$.withOrigin(TreeNode.scala:69)
at org.apache.spark.sql.catalyst.trees.TreeNode.transformUp(TreeNode.scala:334)
...