Existe uma função da biblioteca Python que tenta adivinhar a codificação de caracteres de alguns bytes? [duplicado
Esta pergunta já tem uma resposta aqui:
Como determinar a codificação do texto? 8 respostas Estou escrevendo algum software de processamento de correio em Python que encontra bytes estranhos nos campos do cabeçalho. Eu suspeito que isso seja apenas correio malformado; a mensagem em si afirma ser us-ascii, então não acho que exista uma codificação verdadeira, mas gostaria de obter uma string unicode que se aproxime da original sem gerar umUnicodeDecodeError
.
ntão, eu estou procurando por uma função que leva umstr
e, opcionalmente, algumas dicas e faz o possível para me devolver umunicode
. Eu poderia escrever um é claro, mas se essa função existe, seu autor provavelmente pensou um pouco mais sobre a melhor maneira de fazer iss
Também sei que o design do Python prefere explícito ao implícito e que a biblioteca padrão é projetada para evitar mágica implícita na decodificação de texto. Eu só quero dizer explicitamente "vá em frente e adivinhe".