Policz linie w dużych plikach

Question

Oct 03, 2012, 10:42 PM

Często pracuję z plikami tekstowymi o rozmiarze ~ 20 Gb i bardzo często zliczam liczbę wierszy w danym pliku.

Sposób, w jaki to robię teraz, jest po prostucat fname | wc -li trwa to bardzo długo. Czy jest jakieś rozwiązanie, które byłoby znacznie szybsze?

Pracuję w klastrze o wysokiej wydajności z zainstalowanym Hadoop. Zastanawiałem się, czy podejście do mapy może pomóc.

Chciałbym, aby rozwiązanie było tak proste, jak jedno uruchomienie linii, jakwc -l rozwiązanie, ale nie jestem pewien, jak to możliwe.

Jakieś pomysły?

questionAnswers(12)

różnica między dwiema tablicami

Coś jak funkcja / metoda w plikach wsadowych?

Usuń element z ComboBox (DropDownList) Winforms

Czy istnieje sposób, aby dać kody promocyjne / kuponowe do pobrania aplikacji za darmo?

Okno WPF zgłasza wyjątek TypeInitializationException podczas uruchamiania