ptrepack sortby benötigt einen 'vollen' Index

Ich versuche, eine HDF-Datei zu ptrepacken, die mit der pytables-Schnittstelle von pandas HDFStore erstellt wurde. Der Hauptindex des Datenrahmens war die Zeit, aber ich habe weitere Spalten erstelltdata_columns damit ich über diese data_columns nach Daten auf der Festplatte filtern kann.

Jetzt möchte ich die HDF-Datei nach einer dieser Spalten sortieren (weil die Auswahl für meinen Geschmack zu langsam ist, 84 GB-Datei), indem ich ptrepack mit dem verwendesortby Option wie folgt:

()[maye@luna4 .../nominal]$ ptrepack --chunkshape=auto --propindexes --complevel=9 --complib=blosc --sortby=clat C9.h5 C9_sorted.h5

und ich bekomme die Fehlermeldung:

() [maye @ luna4 ... / nominal] $ Probleme beim Kopieren von 'C9.h5: /' nach 'C9_sorted.h5: /' Der Fehler war ->: Feldclat muss einen 'vollständigen' Index in der Tabelle zugeordnet haben/df/table (Table(390557601,)) ''. Die Zieldatei sieht wie folgt aus: C9_sorted.h5 (Datei) '' Letzte Änderung: 'Fr 26 Jul 18:17:56 2013' Objektbaum: / (RootGroup) '' / df (Group) '' / df / table ( Tabelle (0,), mischen, blosc (9)) ''

Traceback (letzter Aufruf zuletzt): Datei "/ usr / local / epd / bin / ptrepack", Zeile 10, in der Datei "/usr/local/epd/lib/python2.7/site" von sys.exit (main () -packages / tables / scripts / ptrepack.py ", Zeile 480, in main upgradeeflavors = upgradeeflavors) Datei" /usr/local/epd/lib/python2.7/site-packages/tables/scripts/ptrepack.py ", Zeile 225, in copyChildren RuntimeError auslösen ("Bitte überprüfen Sie, dass die Knotennamen nicht" RuntimeError: Überprüfen Sie, ob die Knotennamen im Ziel doppelt vorhanden sind, und fügen Sie in diesem Fall das Flag --overwrite-nodes hinzu, falls gewünscht. Insbesondere zahlen Sie achtung, dass rootUEP dich nicht täuscht.

Bedeutet dies, dass ich eine HDF-Datei nicht nach einer Indexspalte sortieren kann, da es sich nicht um 'vollständige' Indizes handelt?

Antworten auf die Frage(2)

Ihre Antwort auf die Frage