Como verificar o charset de string em Java?
Na minha aplicação eu estou recebendo as informações do usuário do LDAP e, por vezes, o nome de usuário completo vem em um charset errado. Por exemplo:
ТеÑÑ61 ТеÑÑовиÑ61
Também pode ser em inglês ou em russo e exibido corretamente. Se o nome de usuário mudar, ele será atualizado no banco de dados. Mesmo se eu alterar o valor no banco de dados, ele não resolverá o problema.
Eu posso consertar isso antes de salvar fazendo isso
new String(incorrect.getBytes("ISO-8859-1"), "UTF-8");
No entanto, se eu vou usá-lo para a seqüência de caracteres incluindo caracteres em russo (por exemplo, "Тест61 Тестович61") eu recebo algo assim "???? 61 ???????? 61".
Você pode por favor sugerir algo que possa determinar o charset da string?