Resultados da pesquisa a pedido "encoding"
Qual conjunto de caracteres o Microsoft Excel usa ao salvar arquivos?
Eu tenho um aplicativo Java que lê arquivos CSV que foram criados no Excel (por exemplo, 2007). Alguém sabe em que conjunto de caracteres o MS Excel usa para salvar esses arquivos? Eu teria imaginado: Windows-1255 (Cp1255)ISO-8859-1UTF8mas não ...
Algo errado em usar o windows-1252 em vez do UTF-8
Eu tenho um site de teste que usa o Windows-1252 o tempo todo. Eles precisam / usam alguns símbolos como o símbolo da raiz quadrada. E eles não precisam exibir em outro idioma que não seja o inglês. Recentemente, fui convidado a mudar para UTF-8 ...
Estou passando a string corretamente para a biblioteca python?
Estou usando uma biblioteca python chamada Guess Language: http://pypi.python.org/pypi/guess-language/0.1 [http://pypi.python.org/pypi/guess-language/0.1] "justwords" é uma string com texto unicode. Coloco no pacote, mas ele sempre retorna ...
O caractere "<" nos dados JSON é serializado para \ u003c
Eu tenho um objeto JSON onde o valor de um elemento é uma string. Nesta sequência, existem os caracteres"<RPC>". Pego esse objeto JSON inteiro e, no código do servidor ASP.NET, faço o seguinte para pegar o objeto chamadorpc_response e adicione-o ...
Manipulando valores unicode em parâmetros GET com PHP
Eu tenho o seguinte script de teste no meu servidor: <?php echo "Test is: " . $_GET['test']; ?>Se eu ligar com um URL comoexample.com/script.php?test=ɿ (sendo um caractere multibyte), a página resultante fica assim: O teste é: É¿ Se eu tentar ...
Como obter o código UNICODE de cada caractere de uma string UTF-8?
Com o C ++ 11, como posso, de um codificado UTF-8std::string, obtenha o valor Unicode de cada caractere do texto em umuint32_t? Algo como: void f(const std::string &utf8_str) { for(???) { uint32_t code = ???; /* Do my stuff with the code... */ ...
Como ler dados EBCDIC com uma página de códigos não padrão e não bagunçar números?
Aqui está um para os velhos (er) mãos :-) Estou lendo um despejo binário de uma tabela do mainframe DB2. A tabela possui colunas varchar, char, smallint, integer e float. Para torná-lo interessante, o DB2 usa a página de código 424 (hebraico). ...
O código-fonte deve ser salvo no formato UTF-8
Quão importante é salvar seu código fonte no formato UTF-8? O Eclipse no Windows usa a codificação de caracteres CP1252 por padrão. O formato CP1251 significa que caracteres não UTF-8 podem ser salvos e eu já vi isso acontecer se você copiar e ...
UnicodeDecodeError ao executar os.walk
Estou recebendo o erro: 'ascii' codec can't decode byte 0x8b in position 14: ordinal not in range(128)ao tentar fazer o os.walk. O erro ocorre porque alguns dos arquivos em um diretório têm o caractere 0x8b (não-utf8). Os arquivos vêm de um ...
Qual codificação é usada para seqüências de caracteres no Python 2.x?
Qual é a codificação padrão usada para codificar seqüências de caracteres no python 2.x? Eu li que existem duas maneiras possíveis de declarar uma string. string = 'this is a string' unicode_string = u'this is a unicode string'A segunda ...