radzenie sobie z dużymi plikami CSV (20G) w rubinie

Question

Dec 12, 2012, 10:49 PM

radzenie sobie z dużymi plikami CSV (20G) w rubinie

Pracuję nad małym problemem i mam kilka porad, jak go rozwiązać: Biorąc pod uwagę plik csv z nieznaną liczbą kolumn i wierszy, wypisz listę kolumn z wartościami i liczbę powtórzeń każdej wartości. bez korzystania z żadnej biblioteki.

jeśli plik jest mały, nie powinno to stanowić problemu, ale gdy jest kilka Gigs, otrzymuję NoMemoryError: nie można przydzielić pamięci. czy istnieje sposób na utworzenie skrótu i odczyt z dysku zamiast ładowania pliku do pamięci? możesz to zrobić w perlu z związanymi Hashes

EDIT: czy IO # foreach załaduje plik do pamięci? jak o File.open (nazwa pliku) .each?