Wie kann ich eine große CSV-Datei mit Python in kleine Dateien aufteilen, die auf gemeinsamen Datensätzen basieren?
Was ich machen will; was ich vorhabe zu tun
Was ich tun möchte, ist, dass ich eine große CSV-Datei habe. Ich möchte diese große csv-Datei in viele kleine Dateien aufteilen, basierend auf den gemeinsamen Datensätzen in der BB-Spalte, die auch 1 in der HH-Spalte enthalten, und allen ungewöhnlichen Datensätzen, die 0 in der HH-Spalte enthalten.
Als Ergebnis enthalten alle Dateien gemeinsame Datensätze in der BB-Spalte, die 1 in der HH-Spalte enthalten, und alle ungewöhnlichen Datensätze, die keine Datensätze in der BB-Spalte und 0 in der HH-Spalte enthalten. Der Dateiname sollte auf dem gemeinsamen Datensatz von Spalte 2 (BB) basieren. Bitte schauen Sie sich unten das Szenario an. Jeder Vorschlag Idee wird sehr geschätzt.
bigFile.csv:
AA BB CC DD EE FF GG HH
12 53 115 10 3 3 186 1
12 53 01e 23 3 2 1
12 53 0ce 65 1 3 1
12 53 173 73 4 2 1
12 59 115 0 3 3 186 1
12 59 125 0 3 3 186 1
12 61 01e 23 3 2 1
12 61 b6f 0 1 1 1
12 61 b1b 0 6 5 960 1
12 68b 95 3 5 334 0
12 31a 31 2 2 0
12 221 0 4 5 0
12 12b 25 5 4 215 0
12 a10 36 5 1 0
Meine erwarteten Ergebnisdateien lauten wie folgt:
53.csv:
AA BB CC DD EE FF GG HH
12 53 115 10 3 3 186 1
12 53 01e 23 3 2 1
12 53 0ce 65 1 3 1
12 53 173 73 4 2 1
12 68b 95 3 5 334 0
12 31a 31 2 2 0
12 221 0 4 5 0
12 12b 25 5 4 215 0
12 a10 36 5 1 0
59.csv:
AA BB CC DD EE FF GG HH
12 59 115 0 3 3 186 1
12 59 125 0 3 3 186 1
12 68b 95 3 5 334 0
12 31a 31 2 2 0
12 221 0 4 5 0
12 12b 25 5 4 215 0
12 a10 36 5 1 0
61.csv:
AA BB CC DD EE FF GG HH
12 61 01e 23 3 2 1
12 61 b6f 0 1 1 1
12 61 b1b 0 6 5 960 1
12 68b 95 3 5 334 0
12 31a 31 2 2 0
12 221 0 4 5 0
12 12b 25 5 4 215 0
12 a10 36 5 1 0