Awk: Частота слов из одного текстового файла, как вывести в myFile.txt?
Учитывая. TXT файлов с разделенными пробелом словами, такими как:
But where is Esope the holly Bastard
But where is
А такжефункция Awk :
cat /pathway/to/your/file.txt | tr ' ' '\n' | sort | uniq -c | awk '{print $2"@"$1}'
Я получаюследующий вывод в моей консоли:
1 Bastard
1 Esope
1 holly
1 the
2 But
2 is
2 where
Как попасть в напечатанное в myFile.txt? У меня на самом деле 300 000 строк и около 2 миллионов слов. Лучше вывести результат в файл.
РЕДАКТИРОВАТЬ: Используется ответ (@Sudo_O):
$ awk '{a[$1]++}END{for(k in a)print a[k],k}' RS=" |\n" myfile.txt | sort > myfileout.txt