Suchergebnisse für Anfrage "join"

8 die antwort

Skewed Dataset Join in Spark?

Ich verbinde zwei große Datensätze mit Spark RDD. Ein Datensatz ist stark verzerrt, sodass einige der Executor-Aufgaben lange dauern, bis der Job abgeschlossen ist. Wie kann ich dieses Szenario lösen?

2 die antwort

R Überlappungen äquivalent in Python

Ich versuche, einen R-Code in Python umzuschreiben und komme nicht über ein bestimmtes Stück Code hinaus. Ich habe das @ gefundfoverlapsie @ -Funktion in R ist sehr nützlich, wenn Sie einen zeitbasierten Join ausführen, hat aber in Python3 ...

2 die antwort

pandas left join - warum mehr Ergebnisse?

Wie ist es möglich, dass ein Pandas links beitreten wie df.merge(df2, left_on='first', right_on='second', how='left') vergrößert den Datenrahmen von 221309 auf 1388680 Zeilen? bearbeiteshape of df 1 (221309, 83) shape of df2 (7602, 6)

TOP-Veröffentlichungen

6 die antwort

perform Join für mehrere DataFrames in spark

Ich habe 3dataframes aus 3 verschiedenen Prozessen generiert. Jeder Datenrahmen hat Spalten mit demselben Namen. Mein Datenrahmen sieht so aus id val1 val2 val3 val4 1 null null null null 2 A2 A21 A31 A41 id val1 val2 val3 val4 1 B1 B21 B31 B41 ...

2 die antwort

Effizientes Konvertieren von Zeilen in Spalten in der SQL Server-Ansicht

Ich habe 3 Tabellen:testpackage, testpackageReport, testpackagereportdetail mit dieser Struktur: Mit dieser Abfrage SELECT dbo.TestPackages.PackageNumber, dbo.TestPackages.Size, dbo.TestPackages.Code, ...

2 die antwort

Mit MapReduce in MongoDB zwei Sammlungen beitreten

Ich weiß bereits, dass MongoDB keine Join-Operationen unterstützt, aber ich muss ein @ simulier$lookup (aus dem Aggregationsframework) mit demmapReduce Paradigma Meine zwei Sammlungen sind: // Employees sample { "_id" : "1234", "first_name" : ...

8 die antwort

Aufteilen mehrerer Spalten in Zeilen in pandas dataframe

Ich habe einen Pandas-Datenrahmen wie folgt: ticker account value date aa assets 100,200 20121231, 20131231 bb liabilities 50, 150 20141231, 20131231Ich würde gerne aufteilendf['value'] unddf['date'] so dass der Datenrahmen wie folgt ...

16 die antwort

Java: Array von Primitiven mit Trennzeichen verbinden

Angenommen, ich habe ein Array: int[] arr = new int[] {1, 2, 3, 4, 5, 6, 7};Und ich muss seine Elemente mit einem Trennzeichen verbinden, zum Beispiel" - ", als Ergebnis sollte ich einen String wie diesen bekommen: "1 - 2 - 3 - 4 - 5 - 6 - ...

2 die antwort

Self Join erzeugt inkonsistenten Wert für den letzten Monat

Um einige Datensätze des Vormonats in derselben Zeile anzuzeigen, musste ich meine Tabelle folgendermaßen mit sich selbst verknüpfen: SELECT a.[periodOrderNum] ,SUM(a.AktivNy) as ActiveNew ,SUM(b.[AktivNy]) as ActiveNewPrevMonth FROM myTable a ...

4 die antwort

sum Preis von Kindern in anderen Tabelle mysql

Ich habe zwei Tabellen, eine Speicherdatenhierarchie für untergeordnete und übergeordnete Elemente sowie andere Pfade und Nachkommen. +----------+------------+-----------+ | userid | parent | price | +----------+------------+------------ | 1 | ...