Suchergebnisse für Anfrage "pandas"
Kombinieren mehrerer Spalten in einem DataFrame [duplizieren]
Diese Frage hat hier bereits eine Antwort: Gruppieren eines Datenrahmens nach X-Spalten [/questions/34304482/grouping-a-dataframe-by-x-columns] 1 AntwortIch habe einen DataFrame mit 40 Spalten (Spalten 0 bis 39) und möchte sie zu vier ...
Verschiedene Arten von Funktionen zum Trainieren von Naive Bayes in Python Pandas
Ich möchte eine Reihe von Funktionen verwenden, um mit dem Naive Bayes-Klassifikator die Klassifizierung von "A" oder "Nicht-A" zu trainieren. Ich habe drei Merkmale mit unterschiedlichen Werttypen: 1) Gesamtlänge - in positiver Ganzzahl 2) ...
Pandas - Füllen von NaNs in kategoriale Daten
Ich versuche, fehlende Werte (NAN) mit dem folgenden Code zu füllen NAN_SUBSTITUTION_VALUE = 1 g = g.fillna(NAN_SUBSTITUTION_VALUE)aber ich erhalte den folgenden Fehler ValueError: fill value must be in categories. Würde jemand bitte etwas ...
Wie lese ich eine Spalte von csv als dtype-Liste mit pandas?
Ich habe eine CSV-Datei mit 3 Spalten, wobei jede Zeile in Spalte 3 eine Liste mit Werten enthält. Wie Sie der folgenden Tabelle entnehmen können, ist die Struktur Col1,Col2,Col3 1,a1,"['Proj1', 'Proj2']" 2,a2,"['Proj3', ...
Wie kann ein Multiindex-Datenrahmen mit einem einzelnen Index-Datenrahmen verknüpft werden?
Der einzelne Index von df1 stimmt mit einem Sublevel von multiindex von df2 überein. Beide haben die gleichen Spalten. Ich möchte alle Zeilen und Spalten von df1 nach df2 kopieren. Es ähnelt diesem Thread: Kopieren eines Einzelindex-DataFrames ...
pandas lese csv mit zusätzlichen Kommas in der Spalte
Ich lese eine einfache CSV-Datei, in der die Spalten durch Kommas mit den folgenden Spaltennamen getrennt sind: userid, username, body Die body-Spalte ist jedoch eine Zeichenfolge, die Kommas enthalten kann. Offensichtlich verursacht dies ein ...
Wie werden Zellen ausgewählt, die größer als ein Wert in einem Pandas-Datenrahmen mit mehreren Indizes sind?
Probe 1: df[ df > 1.0 ]: dies gab alle Zellen in @ zurüNAN. Try2: df.loc[ df > 1.0 ]: dies gab @ zurüKeyError: 0 df[df['A']> 1.0]: das funktioniert - aber ich möchte die Filterbedingung auf alle Spalten anwenden.
Pandas dataframe - laufende Summe mit Reset
Ich möchte die laufende Summe in einer bestimmten Spalte berechnen (natürlich ohne Schleifen). Die Einschränkung ist, dass ich diese andere Spalte habe, die angibt, wann die laufende Summe auf den in dieser Zeile vorhandenen Wert zurückgesetzt ...
Pandas Pivot oder Groupby für dynamisch generierte Spalten
Ich habe einen Datenrahmen mit Verkaufsinformationen in einem Supermarkt. Jede Zeile im Datenrahmen repräsentiert ein Element mit mehreren Merkmalen als Spalten. Der ursprüngliche DataFrame sieht ungefähr so aus: In [1]: import pandas as pd ...
Wie man IndexError behebt: Ungültiger Index für skalare Variable
Dieser Code generiert einen Fehler: IndexError: invalid index to scalar variable.in der Zeile:results.append(RMSPE(np.expm1(y_train[testcv]), [y[1] for y in y_test])) Wie man es repariert import pandas as pd import numpy as np from sklearn ...