¿Cómo comprobar si una cadena parece aleatoria, o generada por humanos y pronunciable?

Con el fin de identificar [posibles] nombres de usuario generados por bot.

Supongamos que tienes un nombre de usuario como "bilbomoothof" ... puede que no tenga sentido, pero aún así contiene sonidos pronunciables y, por lo tanto, parece generado por humanos.

Acepto que podría haber sido generado aleatoriamente a partir de un diccionario de sílabas, o partes de palabras, pero supongamos por un momento que el bot en cuestión es un poco de basura.

Supongamos que tienes un nombre de usuario como "sdfgbhm342r3f", para un humano esto es claramente una cadena aleatoria. ¿Pero puede ser identificado programáticamente?¿Hay algún algoritmo disponible (similar a Soundex, etc.) que pueda identificar sonidos pronunciables dentro de una cadena como esta?

Soluciones aplicables en PHP / MySQL más apreciadas.

Respuestas a la pregunta(10)

Su respuesta a la pregunta