Удалить повторяющиеся символы из слов
Мне было интересно, как лучше всего конвертировать что-то вроде «haaaaapppppyyy»? на "haappyy".
По сути, при разборе сленга люди иногда повторяют символы для дополнительного акцента.
Мне было интересно, что лучший способ сделать это? С помощьюset()
не работает, потому что порядок букв, очевидно, важен.
Есть идеи? Я использую Python + nltk.