Eliminar los caracteres que se repiten de las palabras

Me preguntaba cuál es la mejor manera de convertir algo como "haaaaapppppyyy" a "haappy".

Básicamente, cuando se analiza la jerga, las personas a veces repiten los caracteres para darle mayor énfasis.

Me preguntaba cuál es la mejor manera de hacer esto? Utilizandoset() No funciona porque el orden de las letras es obviamente importante.

¿Algunas ideas? Estoy usando Python + nltk.

Respuestas a la pregunta(5)

Su respuesta a la pregunta