Zeilen in großen Dateien zählen

Question

Oct 03, 2012, 10:42 PM

Normalerweise arbeite ich mit Textdateien mit einer Größe von ca. 20 GB und zähle sehr oft die Anzahl der Zeilen in einer bestimmten Datei.

So wie ich es jetzt mache, ist es nurcat fname | wc -lund es dauert sehr lange. Gibt es eine Lösung, die viel schneller wäre?

Ich arbeite in einem Hochleistungscluster mit installiertem Hadoop. Ich habe mich gefragt, ob ein Ansatz zur Kartenreduzierung hilfreich sein könnte.

Ich möchte, dass die Lösung so einfach wie ein Zeilenumbruch istwc -l Lösung, aber nicht sicher, wie machbar es ist.

Irgendwelche Ideen?

Antworten auf die Frage(12)

SVG-Donut-Slice als Pfadelement (ringförmiger Sektor)

Was sollte in einem Konstruktor für ein WPF-Fenster vor und nach InitializeComponent () stehen?

Zyklen in einem Graphen mit Tarjans Algorithmus aufzählen

Hat Github eine Ansicht, die Unterschiede zwischen Dateiversionen anzeigt?

Wie erstelle / starte ich dieses einfache Mahout-Programm ohne Ausnahmen?