Resultados da pesquisa a pedido "unicode"
Para que é usado o caractere unicode 2028 (LS / Line Separator)?
Eu estava pensando comigo mesmo que a quebra de linhaproblema deve ser um pouco resolvido por alguém, mas talvez não seja amplamente adotado. Pensando no futuro, fui procurar para ver se havia um método unicode independente da plataforma para ...
Como posso abrir arquivos contendo acentos em Java?
(edição para esclarecimento e adição de algum código) Olá, Temos o requisito de analisar dados enviados por usuários em todo o mundo. Nossos sistemas Linux têm um código de idioma padrão en_US.UTF-8. No entanto, geralmente recebemos arquivos com ...
python pandas read_excel retorna UnicodeDecodeError em descrevem ()
Eu amo pandas, mas estou tendo problemas reais com erros Unicode. read_excel () retorna o temido erro Unicode: import pandas as pd df=pd.read_excel('tmp.xlsx',encoding='utf-8') ...
Python 3 UnicodeDecodeError: o codec 'charmap' não pode decodificar o byte 0x9d
Quero fazer o mecanismo de busca e sigo o tutorial em alguma web. Quero testar a análise html from bs4 import BeautifulSoup def parse_html(filename): """Extract the Author, Title and Text from a HTML file which was produced by pdftotext with the ...
Conversão UTF-16 para UTF-8
Estou atual usando VC ++ 2008 MFC. Como o PostgreSQL não suporta UTF-16 (codificação usada pelo Windows para Unicode), preciso converter a string de UTF-16 em UTF-8 antes de armazená-la. Aqui está o meu trecho de código. // demo.cpp : Defines ...
Como você combina caracteres acentuados e til em uma expressão regular perl (regexp)?
Um usuário digita um conjunto de nomes com acentos e tons: Renato Núñez, David DeJesús, and Edwin EncarnaciónMeu banco de dados tem nomes anglicizados para essas pessoas @names = ('Renato Nunez','David DeJesus','Edwin Encarnacion');Desejo fazer ...
Python não abre nomes de arquivos em japonês
Estou trabalhando em um script python para abrir um arquivo com um nome unicode (principalmente japonês) e salvar em um nome de arquivo (não unicode) gerado aleatoriamente no Windows Vista de 64 bits e estou tendo problemas ... Ele simplesmente ...
Divisão de cadeia com Unicode
Primeiro, eu estava pesquisando na web por essa solução. Como: <''.split(''); > ['','','']Simplesmente expresse o que eu gostaria de fazer. Mas também com outros caracteres Unicode como cocô.
Como converter alguns caracteres multibyte em sua entidade numérica de html usando PHP?
Cadeia de teste: $s = "convert this: "; $s .= "–, —, †, ‡, •, ≤, ≥, μ, ₪, ©, ® y ™, ⅓, ⅔, ⅛, ⅜, ⅝, ⅞, ™, Ω, ℮, ∑, ⌂, ♀, ♂ "; $s .= "but, not convert ordinary characters to entities";
Doctest falha devido a u principal no Unicode
Estou escrevendo um doctest para uma função que gera uma lista de palavras tokenizadas. r''' >>> s = "This is a tokenized sentence s\u00f3" >>> tokenizer.tokenize(s0) ['This', 'is', 'a', 'tokenized', 'sentence', 'só'] '''UsandoPython3.4meu teste ...