Suchergebnisse für Anfrage "hiveql"
Looping mit Hiveql
Ich versuche, 2 Datensätze, z. B. A und B, zusammenzuführen. Der Datensatz A hat eine Variable "Flag", die 2 Werte annimmt. Anstatt beide Daten zusammenzuführen, habe ich versucht, zwei Datensätze basierend auf der Variablen "flag" ...
hive-site.xml Pfad in hive0.13.1
Ich bin ein Neuling. Ich würde gerne das @ kennhive-site.xml undhive-default.xml -Dateispeicherorte inhive-0.13.1 Ausführung Ich habe heruntergeladenhive0.13.1-bin -Version von ...
SparkR von Rstudio - gibt in invokeJava einen Fehler aus (isStatic = TRUE, className, methodName,…):
Ich verwende RStudio. Nach dem Erstellen einer Sitzung, wenn ich versuche, einen Datenrahmen mit R-Daten zu erstellen, tritt ein Fehler auf. Sys.setenv(SPARK_HOME = "E:/spark-2.0.0-bin-hadoop2.7/spark-2.0.0-bin-hadoop2.7") ...
Können HiveConf-Variablen aus einer Datei geladen werden? (Trennen Sie sich von der HiveQL-Datei)
Ich habe oft einen großen HiveQL-Block, den ich mehrmals mit unterschiedlichen Einstellungen für einige Variablen ausführen möchte. Ein einfaches Beispiel wäre: set mindate='2015-01-01 00:00:00' set maxdate='2015-04-01 00:00:00' select * from ...
Hive UDF für die Auswahl aller bis auf einige Spalten
Das gängige Muster für die Abfrageerstellung in HiveQL (und in SQL im Allgemeinen) besteht darin, entweder alle Spalten auszuwählen SELECT *) oder ein explizit angegebener Satz von Spalten SELECT A, B, C). In SQL ist kein Mechanismus zum ...
Delta / Inkrementelle Last im Bienenstock
Ich habe den Anwendungsfall unten: Meine Bewerbung hat eine Tabelle mitmehrjährige DatenimRDBMSDB. Wir haben benutztsqoopum Daten in HDFS zu laden und in eine von partitionierte Hive-Tabelle zu ladenJahr Monat. Die Anwendung wird nun täglich ...
So optimieren Sie den Scan von 1 großen Datei / Tabelle in Hive, um zu überprüfen, ob ein langer Punkt in einer Geometrieform enthalten ist
Ich versuche derzeit, jeden lat long Ping von einem Gerät mit seiner Postleitzahl zu verknüpfen. Ich habe Geräte-Ping-Daten für lange Zeiträume normalisiert und eine produktübergreifende / kartesische Produktverknüpfungstabelle erstellt, in ...
annst du erklären, wann und warum Mapreduce in Hive aufgerufen wir
select * from Table_name limit 5; select col1_name,col2_name from table_name limit 5; Wenn ich die erste Abfrage starte, wird kein MapReduce aufgerufen, während für andere MapReduce aufgerufen wird. Könnten Sie bitte den Grund erklären.
Erstellen von Hive-Partitionen für mehrere Monate mithilfe eines Skripts
Ich habe Daten für 4 Jahre. Mögen '2011 2012 2013 2014'Ich muss Abfragen basierend auf den Daten eines Monats ausführen. Also erstelle ich Partitionen wie unten. 'ALTER TABLE table1_2010Jan ADD PARTITION(year='2010', month='01', ...