java utf8 encoding - char, typy łańcuchów

Question

Aug 30, 2012, 12:59 AM

java utf8 encoding - char, typy łańcuchów

public class UTF8 {
    public static void main(String[] args){
        String s = "ﾖ"; //0xFF6E
        System.out.println(s.getBytes().length);//length of the string
        System.out.println(s.charAt(0));//first character in the string
    }
}

wydajność:

3
ﾖ

Pomóż mi to zrozumieć. Próbuję zrozumieć, jak działa kodowanie utf8 w Javie. Jak w definicji java docchar: Typ danych char jest pojedynczym 16-bitowym znakiem Unicode.

Czy to znaczy, że typ char w java może obsługiwać tylko te znaki Unicode, które mogą być reprezentowane przez 2 bajty i nie więcej niż to?

W powyższym programie, liczba bajtów przydzielonych dla tego ciągu wynosi 3, ale w trzeciej linii, która zwraca pierwszy znak (2 bajty w java), może zawierać znak o długości 3 bajtów? naprawdę zdezorientowany?

Wszelkie dobre odniesienia dotyczące tej koncepcji w Javie / General byłyby naprawdę mile widziane.

questionAnswers(4)

Popularne pytania

0 odpowiedzi

Jak przetestować aplikację opartą na Bluetooth na Androidx86 na VirtualBox z wbudowanym bluetoothem do laptopa

0 odpowiedzi

python - pamięć nie jest zwracana do jądra

0 odpowiedzi

AngularJS Przechwytuj wszystkie odpowiedzi $ http JSON

0 odpowiedzi

mapowanie psycopg2 Python: „lista dyktatów” dla Postgres: „tablica typu złożonego” dla instrukcji INSERT

0 odpowiedzi

Błąd FPDF: ten dokument (testcopy.pdf) prawdopodobnie wykorzystuje technikę kompresji, która nie jest obsługiwana przez bezpłatny parser dostarczany z FPDI

Jesteś bardzo aktywny! To świetnie!

java utf8 encoding - char, typy łańcuchów

questionAnswers(4)

yourAnswerToTheQuestion

Popularne pytania