Suchergebnisse für Anfrage "dataframe"

2 die antwort

pyspark: DataFrame in RDD konvertieren [string]

Ich würde gerne konvertierenpyspark.sql.dataframe.DataFrame zupyspark.rdd.RDD[String] Ich habe einen DataFrame konvertiertdf zu RDDdata: data = df.rdd type (data) ## pyspark.rdd.RDDdie neue RDDdata enthältRow first = data.first() type(first) ...

4 die antwort

Wie werden die Zeilennamen eines Datenrahmens festgelegt, der mit dem Pipe-Operator%>% übergeben wird?

Ich habe einen Datenrahmen, der ich bindcasting mit demreshape2 package, und ich möchte die erste Spalte entfernen und stattdessen die Zeilennamen des Datenrahmens verwenden. Original dataframe, vordcast: > corner(df) ID_full gene cpm 1 S36-A1 ...

4 die antwort

Error: nrow (x) == n ist nicht WAHR, wenn Train in Caret @ verwendet wi

Ich habe ein Trainingsset, das aussieht wie Name Day Area X Y Month Night ATTACK Monday LA -122.41 37.78 8 0 VEHICLE Saturday CHICAGO -1.67 3.15 2 0 MOUSE Monday TAIPEI -12.5 3.1 9 1Name ist das Ergebnis / die abhängige Variable. Ich ...

TOP-Veröffentlichungen

4 die antwort

summary dataframe von mehreren Regressionsausgaben

Ich mache mehrere OLS-Regressionen. Ich habe folgende lm funktion benutzt: GroupNetReturnsStockPickers <- read.csv("GroupNetReturnsStockPickers.csv", header=TRUE, sep=",", dec=".") ModelGroupNetReturnsStockPickers <- lm(StockPickersNet ~ ...

10 die antwort

Werte in einem Datenrahmen basierend auf der Nachschlagetabelle ersetzen

Ich habe Probleme beim Ersetzen von Werten in einem Datenrahmen. Ich möchte Werte basierend auf einer separaten Tabelle ersetzen. Unten ist ein Beispiel für das, was ich versuche. Ich habe eine Tabelle, in der jede Zeile ein Kunde und jede ...

4 die antwort

Wirksamste Methode zum Konvertieren von Spaltenwerten in Pandas DataFrame

Ich habe einen pd.DataFrame, der so aussieht: [/imgs/17YRS.png] Ich möchte einen Grenzwert für die Werte erstellen, um sie in Binärziffern zu verschieben. Mein Grenzwert in diesem Fall ist0.85. Ich möchte, dass der resultierende Datenrahmen ...

2 die antwort

Zeilenweise Summe der Werte, gruppiert nach gleichnamigen Spalten

Ich habe einen Datenrahmen, in dem mehrere Spalten denselben Namen haben können. In diesem kleinen Beispiel kommen die beiden Spalten "A" und "G" zweimal vor: A C G A G T 1 1 NA NA NA 1 NA 2 1 NA 5 3 1 NA 3 NA 1 NA NA NA 1 4 NA NA 1 2 NA NA 5 NA ...

8 die antwort

Filtern eines Pyspark DataFrame mit einer SQL-ähnlichen IN-Klausel

Ich möchte einen Pyspark DataFrame mit einem SQL-ähnlichen @ filterIN -Klausel, wie in sc = SparkContext() sqlc = SQLContext(sc) df = sqlc.sql('SELECT * from my_df WHERE field1 IN a')woa ist das Tupel(1, 2, 3). Ich erhalte folgenden Fehler: ...

12 die antwort

Wie füge ich Spark DataFrame eine persistente Spalte mit Zeilen-IDs hinzu?

Diese Frage ist nicht neu, aber ich finde überraschendes Verhalten in Spark. Ich muss einem DataFrame eine Spalte mit Zeilen-IDs hinzufügen. Ich habe die DataFrame-Methode monotonically_increasing_id () verwendet, und es gibt mir eine zusätzliche ...

10 die antwort

Ein Datenframe auf die Zeilen setzen, die nicht in einem anderen Datenframe erscheinen

Ich habe einen Datenrahmen A mit Beobachtungen Var1 Var2 Var3 1 3 4 2 5 6 4 5 7 4 5 8 6 7 9und Datenrahmen B mit Beobachtungen Var1 Var2 Var3 1 3 4 2 5 6un möchte ich Beobachtungen in A NICHT in B auswählen, d. h. den Datenrahmen C mit ...