Fortschrittsanzeige bei Pandas-Operationen (Python)

Ich führe regelmäßig Pandas-Operationen mit Datenrahmen aus, die mehr als 15 Millionen Zeilen umfassen, und ich hätte gerne Zugriff auf eine Fortschrittsanzeige für bestimmte Operationen.

Gibt es eine textbasierte Fortschrittsanzeige für Pandas Split-Apply-Combine-Vorgänge?

Zum Beispiel in etwas wie:

df_users.groupby(['userID', 'requestDate']).apply(feature_rollup)

woherfeature_rollup ist eine etwas komplizierte Funktion, die viele DF-Spalten benötigt und mit verschiedenen Methoden neue Benutzerspalten erstellt. Diese Vorgänge können bei großen Datenrahmen eine Weile dauern, daher möchte ich wissen, ob eine textbasierte Ausgabe in einem iPython-Notizbuch möglich ist, mit der ich über den Fortschritt informiert werde.

Bisher habe ich kanonische Loop-Fortschrittsindikatoren für Python ausprobiert, aber sie interagieren nicht auf sinnvolle Weise mit Pandas.

Ich hoffe, dass es etwas gibt, das ich in der Pandas-Bibliothek / Dokumentation übersehen habe, das es einem ermöglicht, den Fortschritt eines Split-Apply-Mähdreschers zu kennen. Eine einfache Implementierung würde sich möglicherweise mit der Gesamtzahl der Datenrahmen-Teilmengen befassen, auf denen dieapply Die Funktion arbeitet und meldet den Fortschritt als den vollständigen Bruchteil dieser Teilmengen.

Ist dies möglicherweise etwas, das der Bibliothek hinzugefügt werden muss?

Antworten auf die Frage(6)

Ihre Antwort auf die Frage