Suchergebnisse für Anfrage "pandas"

8 die antwort

Kombinieren mehrerer Spalten in einem DataFrame [duplizieren]

Diese Frage hat hier bereits eine Antwort: Gruppieren eines Datenrahmens nach X-Spalten [/questions/34304482/grouping-a-dataframe-by-x-columns] 1 AntwortIch habe einen DataFrame mit 40 Spalten (Spalten 0 bis 39) und möchte sie zu vier ...

4 die antwort

Verschiedene Arten von Funktionen zum Trainieren von Naive Bayes in Python Pandas

Ich möchte eine Reihe von Funktionen verwenden, um mit dem Naive Bayes-Klassifikator die Klassifizierung von "A" oder "Nicht-A" zu trainieren. Ich habe drei Merkmale mit unterschiedlichen Werttypen: 1) Gesamtlänge - in positiver Ganzzahl 2) ...

8 die antwort

Pandas - Füllen von NaNs in kategoriale Daten

Ich versuche, fehlende Werte (NAN) mit dem folgenden Code zu füllen NAN_SUBSTITUTION_VALUE = 1 g = g.fillna(NAN_SUBSTITUTION_VALUE)aber ich erhalte den folgenden Fehler ValueError: fill value must be in categories. Würde jemand bitte etwas ...

TOP-Veröffentlichungen

4 die antwort

Wie lese ich eine Spalte von csv als dtype-Liste mit pandas?

Ich habe eine CSV-Datei mit 3 Spalten, wobei jede Zeile in Spalte 3 eine Liste mit Werten enthält. Wie Sie der folgenden Tabelle entnehmen können, ist die Struktur Col1,Col2,Col3 1,a1,"['Proj1', 'Proj2']" 2,a2,"['Proj3', ...

2 die antwort

Wie kann ein Multiindex-Datenrahmen mit einem einzelnen Index-Datenrahmen verknüpft werden?

Der einzelne Index von df1 stimmt mit einem Sublevel von multiindex von df2 überein. Beide haben die gleichen Spalten. Ich möchte alle Zeilen und Spalten von df1 nach df2 kopieren. Es ähnelt diesem Thread: Kopieren eines Einzelindex-DataFrames ...

2 die antwort

pandas lese csv mit zusätzlichen Kommas in der Spalte

Ich lese eine einfache CSV-Datei, in der die Spalten durch Kommas mit den folgenden Spaltennamen getrennt sind: userid, username, body Die body-Spalte ist jedoch eine Zeichenfolge, die Kommas enthalten kann. Offensichtlich verursacht dies ein ...

2 die antwort

Wie werden Zellen ausgewählt, die größer als ein Wert in einem Pandas-Datenrahmen mit mehreren Indizes sind?

Probe 1: df[ df > 1.0 ]: dies gab alle Zellen in @ zurüNAN. Try2: df.loc[ df > 1.0 ]: dies gab @ zurüKeyError: 0 df[df['A']> 1.0]: das funktioniert - aber ich möchte die Filterbedingung auf alle Spalten anwenden.

2 die antwort

Pandas dataframe - laufende Summe mit Reset

Ich möchte die laufende Summe in einer bestimmten Spalte berechnen (natürlich ohne Schleifen). Die Einschränkung ist, dass ich diese andere Spalte habe, die angibt, wann die laufende Summe auf den in dieser Zeile vorhandenen Wert zurückgesetzt ...

2 die antwort

Pandas Pivot oder Groupby für dynamisch generierte Spalten

Ich habe einen Datenrahmen mit Verkaufsinformationen in einem Supermarkt. Jede Zeile im Datenrahmen repräsentiert ein Element mit mehreren Merkmalen als Spalten. Der ursprüngliche DataFrame sieht ungefähr so aus: In [1]: import pandas as pd ...

2 die antwort

Wie man IndexError behebt: Ungültiger Index für skalare Variable

Dieser Code generiert einen Fehler: IndexError: invalid index to scalar variable.in der Zeile:results.append(RMSPE(np.expm1(y_train[testcv]), [y[1] for y in y_test])) Wie man es repariert import pandas as pd import numpy as np from sklearn ...