Codificação UTF-16 em Java versus C #

Question

Jan 25, 2011, 01:19 PM

Codificação UTF-16 em Java versus C #

Estou tentando ler uma seqüência de caracteres no esquema de codificação UTF-16 e executar o hash MD5 nele. Mas, estranhamente, Java e C # estão retornando resultados diferentes quando tento fazer isso.

A seguir está o trecho de código emJava:

public static void main(String[] args) {
    String str = "preparar mantecado con coca cola";
    try {
        MessageDigest digest = MessageDigest.getInstance("MD5");
        digest.update(str.getBytes("UTF-16"));
        byte[] hash = digest.digest();
        String output = "";
        for(byte b: hash){
            output += Integer.toString( ( b & 0xff ) + 0x100, 16).substring( 1 );
        }
        System.out.println(output);
    } catch (Exception e) {

    }
}

A saída para isso é:249ece65145dca34ed310445758e5504

A seguir está o trecho de código emC #:

   public static string GetMD5Hash()
        {
            string input = "preparar mantecado con coca cola";
            System.Security.Cryptography.MD5CryptoServiceProvider x = new System.Security.Cryptography.MD5CryptoServiceProvider();
            byte[] bs = System.Text.Encoding.Unicode.GetBytes(input);
            bs = x.ComputeHash(bs);
            System.Text.StringBuilder s = new System.Text.StringBuilder();
            foreach (byte b in bs)
            {
                s.Append(b.ToString("x2").ToLower());
            }
            string output= s.ToString();
            Console.WriteLine(output);
        }

A saída para isso é:c04d0f518ba2555977fa1ed7f93ae2b3

Não sei por que as saídas não são as mesmas. Como alteramos o trecho de código acima, para que ambos retornem a mesma saída?