¿Cómo manejar palabras de argot y formas cortas en Tweets como luv, kool y brb?

Estoy haciendo un preprocesamiento de tweets usando Python. Sin embargo, muchas palabras utilizadas son formas cortas de otras palabras como luv, kool, etc. Y también, abreviaturas como brb, ttyl, etc.

En este momento, solo puedo pensar en tener un gran Hashmap con palabras como claves y las palabras o expansiones reales como valores. ¿Hay alguna otra mejor manera de abordar esto usando PNL?

NOTA: Sé que la pregunta parece demasiado vaga. Pero por favor no lo informe. He preguntado esto para que los aficionados puedan beneficiarse de este conocimiento.

PD: ¿Hay una lista de texto bien formateada que pueda descargar y usar? Los enlaces colocados son buenos, pero cuando lo copio y pego, no están en un formato fácilmente analizable

Respuestas a la pregunta(1)

Su respuesta a la pregunta