Suchergebnisse für Anfrage "pandas"

14 die antwort

Zeitstempelspalte in separate Datums- und Zeitspalten aufteilen

Ich habe einen Pandas-Datenrahmen mit über 1000 Zeitstempeln (siehe unten), den ich durchlaufen möchte: 2016-02-22 14:59:44.561776 Es fällt mir schwer, diesen Zeitstempel in zwei Spalten aufzuteilen: 'Datum' und 'Uhrzeit'. Das Datumsformat kann ...

2 die antwort

Ersten Buchstaben eines Strings aus Spalte @ hol

Ich kämpfe mit Pandas und verliere vorerst. Ich habe eine Quelltabelle ähnlich der folgenden: import pandas as pd a=pd.Series([123,22,32,453,45,453,56]) b=pd.Series([234,4353,355,453,345,453,56]) df=pd.concat([a, b], ...

4 die antwort

Python Pandas maximaler Wert in einer Gruppe als neue Spalte

Ich versuche, eine neue Spalte zu berechnen, die Maximalwerte für jede von mehreren Gruppen enthält. Ich komme aus einem Stata-Hintergrund, daher weiß ich, dass der Stata-Code ungefähr so aussehen würde: by group, sort: egen max = ...

TOP-Veröffentlichungen

2 die antwort

In CSV-Datei als Datenframe von hdfs lesen

Ich benutze pydoop, um eine Datei von hdfs einzulesen, und wenn ich benutze: import pydoop.hdfs as hd with hd.open("/home/file.csv") as f: print f.read() Es zeigt mir die Datei in stdout. Gibt es eine Möglichkeit, diese Datei als Datenframe ...

10 die antwort

Wie werden doppelte Zeilen in Pandas-Datenrahmen gezählt?

Ich versuche, die Duplikate aller Zeilentypen in meinem Datenframe zu zählen. Angenommen, ich habe einen Datenrahmen in pandas wie folgt: df = pd.DataFrame({'one': pd.Series([1., 1, 1]), 'two': pd.Series([1., 2., 1])}) Ich bekomme eine df, die ...

2 die antwort

Wie übergebe ich einen Parameter in scikit learn nur an einen Teil eines Pipeline-Objekts?

Ich muss einen Parameter übergeben,sample_weight, zu meinemRandomForestClassifier wie so: X = np.array([[2.0, 2.0, 1.0, 0.0, 1.0, 3.0, 3.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 5.0, 3.0, 2.0, ...

2 die antwort

Python Pandas Distanzmatrix mit Jaccard-Ähnlichkeit

Ich habe eine Funktion implementiert, um eine Distanzmatrix unter Verwendung der Jaccard-Ähnlichkeit zu konstruieren: import pandas as pd entries = [ {'id':'1', 'category1':'100', 'category2': '0', 'category3':'100'}, {'id':'2', ...

2 die antwort

Wie die Tagesdifferenz zwischen aufeinanderfolgenden Pandas-Datenrahmenzeilen mit der Bedingung @ berechnet wi

Ich habe einen Pandas-Datenrahmen wie folgt .. item_id date 101 2016-01-05 101 2016-01-21 121 2016-01-08 121 2016-01-22 128 2016-01-19 128 2016-02-17 131 2016-01-11 131 2016-01-23 131 2016-01-24 131 2016-02-06 131 2016-02-07Ich möchte die ...

4 die antwort

Wirksamste Methode zum Konvertieren von Spaltenwerten in Pandas DataFrame

Ich habe einen pd.DataFrame, der so aussieht: [/imgs/17YRS.png] Ich möchte einen Grenzwert für die Werte erstellen, um sie in Binärziffern zu verschieben. Mein Grenzwert in diesem Fall ist0.85. Ich möchte, dass der resultierende Datenrahmen ...

2 die antwort

Mein Jupyter-Notebook kann Anaconda-Module nicht konsistent importieren

Ich kann mit meinem Jupyter-Notebook keine Module richtig importieren. Das Seltsame ist, dass ich mit Sublime zwar Numpy, aber keine Pandas importieren kann. Ich habe alle Python-bezogenen Inhalte auf meinem Mac gelöscht und Anaconda ...