Suchergebnisse für Anfrage "dataframe"

2 die antwort

python Spalten des Datenrahmens in mehrere Zeilen aufteilen

Ich habe einen Datenrahmen wie diesen: -------------------------------------------------------------------- Product ProductType SKU Size -------------------------------------------------------------------- T-shirt Top [111,222,333,444] ...

2 die antwort

Sklearn Error, Array mit 4 Dim. Estimator <= 2

Ich habe versucht, Daten aus Yahoo Finance über Panda zu importieren und sie dann über .as_matrix () in Arrays zu konvertieren. Wenn ich dann die Daten zum Trainieren in den Classifer eingebe, erhalte ich eine Fehlermeldung. ValueError: Found ...

2 die antwort

ValueError: Tag liegt für Monat außerhalb des zulässigen Bereichs

Ich möchte eine Zeichenfolge von einem Datenrahmen in datetime konvertieren. dfx = df.ix[:,'a'] dfx = pd.to_datetime(dfx)Aber es gibt den folgenden Fehler: ValueError: Tag liegt für Monat außerhalb des zulässigen Bereichs Kann jemand helfen

TOP-Veröffentlichungen

4 die antwort

Pandas DataFrame nach Wert sortieren

Ich weiß, dass diese Frage viele Antworten hat, zum Beispiel:Wie sortiere ich Pandas-Datenrahmen anhand von Werten aus mehreren ...

6 die antwort

Filter Pyspark-Datenrahmenspalte mit dem Wert None

Ich versuche, einen PySpark-Datenrahmen mit @ zu filterNone als Zeilenwert: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), ...

10 die antwort

Verwenden, wenn sonst in einem Datenframe über mehrere Spalten

Ich habe einen großen Datensatz von Stichproben mit Deskriptoren darüber, ob die Stichprobe lebensfähig ist - sie sieht ungefähr so aus, wobei "desc" die Beschreibungsspalte ist und "blank" angibt, dass die Stichprobe nicht lebensfähig ist: desc ...

8 die antwort

R: Aktualisieren eines Datenrahmens mit einem anderen Datenrahmen

Nehmen wir an, unser anfänglicher Datenrahmen sieht folgendermaßen aus: df1 = data.frame(Index=c(1:6),A=c(1:6),B=c(1,2,3,NA,NA,NA),C=c(1,2,3,NA,NA,NA)) > df1 Index A B C 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 NA NA 5 5 5 NA NA 6 6 6 NA NA Ein ...

8 die antwort

Wie Spalten explodieren?

Nach val df = Seq((1, Vector(2, 3, 4)), (1, Vector(2, 3, 4))).toDF("Col1", "Col2")Ich habe diesen DataFrame in Apache Spark: +------+---------+ | Col1 | Col2 | +------+---------+ | 1 |[2, 3, 4]| | 1 |[2, 3, 4]| +------+---------+Wie konvertiere ...

2 die antwort

Pivot String-Spalte in Pyspark Dataframe

Ich habe einen einfachen Datenrahmen wie diesen: rdd = sc.parallelize( [ (0, "A", 223,"201603", "PORT"), (0, "A", 22,"201602", "PORT"), (0, "A", 422,"201601", "DOCK"), (1,"B", 3213,"201602", "DOCK"), (1,"B", 3213,"201601", "PORT"), (2,"C", ...

8 die antwort

Python / Pandas Dataframe 0 durch Medianwert ersetzen

Ich habe einen Python Pandas-Datenrahmen mit mehreren Spalten und eine Spalte hat0 Werte. Ich möchte das @ ersetz0 Werte mit demmedian odermean dieser Spalte. data ist mein Datenrahmen artist_hotness ist die Spalte mean_artist_hotness = ...