Codificação oficial usada pela Twitter Streaming API? É UTF-8?
Qual é a codificação oficial da API de streaming do Twitter? Meu melhor palpite é o UTF-8, com base no que vi, mas gostaria de evitar fazer suposições.
A única parte do site do Twitter que eu vi onde eles até sugerem o que usam como codificação oficial está aqui:
@Twitter não deseja penalizar um usuário pelo fato de usarmos o UTF-8 ou pelo fato de o cliente da API em questão usar a representação mais longa
https: //dev.twitter.com/docs/counting-character
Alguém tem uma resposta mais "oficial"? Estou escrevendo um tokenizer de máquina de estado para a API de streaming que faz certas suposições. A última coisa que quero é encontrar algo como UTF-16.
Obrigado! : D