como verificar se uma string parece randomizada ou gerada por humanos e pronunciável?
Com o propósito de identificar [possíveis] nomes de usuários gerados por bots.
Suponha que você tenha um nome de usuário como "bilbomoothof" .. pode ser um absurdo, mas ainda contém sons pronunciáveis e, portanto, aparece gerado pelo homem.
Eu aceito que ele poderia ter sido gerado aleatoriamente a partir de um dicionário de sílabas, ou partes de palavras, mas vamos supor por um momento que o bot em questão é um pouco lixo.
Suponha que você tenha um nome de usuário como "sdfgbhm342r3f", para um humano, isso é claramente uma string aleatória. Mas isso pode ser identificado programaticamente?Existem algoritmos disponíveis (semelhantes ao Soundex, etc.) que podem identificar sons pronunciáveis dentro de uma string como essa?Soluções aplicáveis em PHP / MySQL mais apreciadas.