Suchergebnisse für Anfrage "pandas"
Zeitstempelspalte in separate Datums- und Zeitspalten aufteilen
Ich habe einen Pandas-Datenrahmen mit über 1000 Zeitstempeln (siehe unten), den ich durchlaufen möchte: 2016-02-22 14:59:44.561776 Es fällt mir schwer, diesen Zeitstempel in zwei Spalten aufzuteilen: 'Datum' und 'Uhrzeit'. Das Datumsformat kann ...
Ersten Buchstaben eines Strings aus Spalte @ hol
Ich kämpfe mit Pandas und verliere vorerst. Ich habe eine Quelltabelle ähnlich der folgenden: import pandas as pd a=pd.Series([123,22,32,453,45,453,56]) b=pd.Series([234,4353,355,453,345,453,56]) df=pd.concat([a, b], ...
Python Pandas maximaler Wert in einer Gruppe als neue Spalte
Ich versuche, eine neue Spalte zu berechnen, die Maximalwerte für jede von mehreren Gruppen enthält. Ich komme aus einem Stata-Hintergrund, daher weiß ich, dass der Stata-Code ungefähr so aussehen würde: by group, sort: egen max = ...
In CSV-Datei als Datenframe von hdfs lesen
Ich benutze pydoop, um eine Datei von hdfs einzulesen, und wenn ich benutze: import pydoop.hdfs as hd with hd.open("/home/file.csv") as f: print f.read() Es zeigt mir die Datei in stdout. Gibt es eine Möglichkeit, diese Datei als Datenframe ...
Wie werden doppelte Zeilen in Pandas-Datenrahmen gezählt?
Ich versuche, die Duplikate aller Zeilentypen in meinem Datenframe zu zählen. Angenommen, ich habe einen Datenrahmen in pandas wie folgt: df = pd.DataFrame({'one': pd.Series([1., 1, 1]), 'two': pd.Series([1., 2., 1])}) Ich bekomme eine df, die ...
Wie übergebe ich einen Parameter in scikit learn nur an einen Teil eines Pipeline-Objekts?
Ich muss einen Parameter übergeben,sample_weight, zu meinemRandomForestClassifier wie so: X = np.array([[2.0, 2.0, 1.0, 0.0, 1.0, 3.0, 3.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 5.0, 3.0, 2.0, ...
Python Pandas Distanzmatrix mit Jaccard-Ähnlichkeit
Ich habe eine Funktion implementiert, um eine Distanzmatrix unter Verwendung der Jaccard-Ähnlichkeit zu konstruieren: import pandas as pd entries = [ {'id':'1', 'category1':'100', 'category2': '0', 'category3':'100'}, {'id':'2', ...
Wie die Tagesdifferenz zwischen aufeinanderfolgenden Pandas-Datenrahmenzeilen mit der Bedingung @ berechnet wi
Ich habe einen Pandas-Datenrahmen wie folgt .. item_id date 101 2016-01-05 101 2016-01-21 121 2016-01-08 121 2016-01-22 128 2016-01-19 128 2016-02-17 131 2016-01-11 131 2016-01-23 131 2016-01-24 131 2016-02-06 131 2016-02-07Ich möchte die ...
Wirksamste Methode zum Konvertieren von Spaltenwerten in Pandas DataFrame
Ich habe einen pd.DataFrame, der so aussieht: [/imgs/17YRS.png] Ich möchte einen Grenzwert für die Werte erstellen, um sie in Binärziffern zu verschieben. Mein Grenzwert in diesem Fall ist0.85. Ich möchte, dass der resultierende Datenrahmen ...
Mein Jupyter-Notebook kann Anaconda-Module nicht konsistent importieren
Ich kann mit meinem Jupyter-Notebook keine Module richtig importieren. Das Seltsame ist, dass ich mit Sublime zwar Numpy, aber keine Pandas importieren kann. Ich habe alle Python-bezogenen Inhalte auf meinem Mac gelöscht und Anaconda ...