Usuń powtarzające się znaki ze słów
Zastanawiałem się, jaki jest najlepszy sposób przekonwertowania czegoś takiego jak „haaaaapppppyyy” na „haappyy”.
Zasadniczo, podczas analizowania slangu, ludzie czasami powtarzają znaki w celu zwiększenia nacisku.
Zastanawiałem się, jak najlepiej to zrobić? Za pomocąset()
nie działa, ponieważ kolejność liter jest oczywiście ważna.
Jakieś pomysły? Używam Pythona + nltk.