Konwersja częstotliwości słowa na histogram graficzny w Pythonie
Właśnie to mam teraz, dzięki Pavlowi Anossovowi. Próbuję przekonwertować częstotliwość słowa, która została wyprowadzona na gwiazdki.
import sys
import operator
from collections import Counter
def candidateWord():
with open("sample.txt", 'r') as f:
text = f.read()
words = [w.strip('!,.?1234567890-=@#$%^&*()_+')for w in text.lower().split()]
#word_count[words] = word_count.get(words,0) + 1
counter = Counter(words)
print("\n".join("{} {}".format(*p) for p in counter.most_common()))
candidateWord()
To właśnie mam teraz jako wyjście.
how 3
i 2
am 2
are 2
you 2
good 1
hbjkdfd 1
Formuła, którą chcę wypróbować i użyć, jest najczęściej występującym słowem M razy, a obecne słowo pojawia się N razy, liczba wydrukowanych gwiazdek to:
(50 * N) / M