Como contar frequências de palavra dentro de um arquivo em python
Eu tenho um arquivo .txt com o seguinte formato,
C
V
EH
A
IRQ
C
C
H
IRG
V
Embora, obviamente, é muito maior do que isso, isso é essencialmente it.Basicamente estou tentando somar quantas vezes cada string individual está no arquivo (cada letra / string está em uma linha separada, então tecnicamente o arquivo é C \ nV \ nEH \ n etc. No entanto, quando eu tento converter esses arquivos em uma lista e, em seguida, uso a função count, ela separa as letras para que strings como 'IRQ' sejam ['\ n'I', 'R' , 'Q', '\ n'] então quando eu contar eu recebo as freqüências de cada letra individual e não das strings.
Aqui está o código que escrevi até agora,
def countf():
fh = open("C:/x.txt","r")
fh2 = open("C:/y.txt","w")
s = []
for line in fh:
s += line
for x in s:
fh2.write("{:<s} - {:<d}".format(x,s.count(x))
O que eu quero acabar é um arquivo de saída que se parece com isso
C 10
V 32
EH 7
A 1
IRQ 9
H 8