Resultados da pesquisa a pedido "unicode"

2 a resposta

ecodificação de entidades HTML com Python

O código Python a seguir usa o BeautifulStoneSoup para buscar as informações da API do LibraryThing para "The Children of Húrin" de Tolkie import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...

6 a resposta

arquivo de leitura do @Java obteve uma BOM principal [ï »¿]

Estou lendo um arquivo que contém palavras-chave linha por linha e encontrou um problema estranho. Espero que as linhas que seguem um ao outro se seu conteúdo seja o mesmo, devam ser tratadas apenas uma vez. Gosta sony sony Apenas o primeiro ...

5 a resposta

Como converter uma matriz TCHAR para std :: string?

Como converter umTCHAR matriz parastd::string (não parastd::basic_string)?

3 a resposta

Limite de palavras regex para cadeias de bytes múltiplos

Estou usando a biblioteca posix c regex (regcomp / regexec) no meu aplicativo de pesquisa. Meu aplicativo suporta idiomas diferentes, incluindo aqueles que usam caracteres de vários bytes. Estou com um problema ao usar o metacaractere de limite ...

1 a resposta

Regex correto do Utf8 para o CamelCase (WikiWord) em perl

Aqui estava uma pergunta sobre oCamelCase regex [https://stackoverflow.com/questions/815787/what-perl-regex-can-match-camelcase-words] . Com a combinação detchrist ...

16 a resposta

FPDF codificação utf-8 (HOW-TO)

Alguém sabe como definir a codificação no pacote FPDF para utf-8? Ou pelo menos a ISO-8859-7 (grego) que suporta caracteres gregos? Basicamente, eu quero criar um arquivo pdf contendo caracteres grego Qualquer sugestão ajudaria. George

8 a resposta

python: unicode no terminal do Windows, codificação usada?

Estou usando o interpretador Python no terminal do Windows 7. Estou tentando entender meu código e codificações unicod Eu digito >>> s='ë' >>> s '\x89' >>> u=u'ë' >>> u u'\xeb'Questão : Por que a codificação é usada na strings diferente daquele ...

3 a resposta

possível converter caracteres específicos do idioma em caracteres latinos em UTF8

Estou imaginando se há algum relacionamento ou algoritmo existente que permita a conversão de caracteres nacionais para caracteres latinos equivalentes na página de códigos UTF Por exemplo (em polonês): Ą -> A Ó -> O ż -> z ź -> z ...

2 a resposta

PHP: remova palavras com menos de 3 caracteres no texto unicode

Utilizo estas expressões regulares para remover palavras com menos de 3 caracteres: $str = preg_replace("!\\b\\w{1,3}\\b!", "", $str); $rdu = "/\b[^\b]{1,2}\b/"; $str = preg_replace($rdu , " ", " " . $str . " "); mas no texto unicode ...

1 a resposta

Converte uma string / número inteiro para sobrescrito em C #

Existe uma função .NET incorporada ou uma maneira fácil de converter de: "01234"para "\u2070\u00B9\u00B2\u00B3\u2074" Observe que os sobrescritos 1, 2 e 3 não estão no intervalo \ u2070- \ u209F [http://www.unicode.org/charts/PDF/U2070.pdf] ...