Resultados da pesquisa a pedido "character-properties"

1 a resposta

Correspondência de traços Unicode em expressões regulares Java?

Estou tentando criar uma expressão regular Java para dividir seqüências de caracteres do formato geral "foo-bar" em "foo" e "bar" usando Pattern.split (). O caractere "-" pode ser um dos vários hífens: o ASCII '-', o traço em-, o traço, etc. Eu ...

1 a resposta

Substituir caracteres de controle Unicode

Preciso substituir todo caractere de controle especial em uma string em Java. Quero perguntar à API do Google Maps v3, e o Google não parece gostar ...

5 a resposta

Como saber a largura de exibição preferida (em colunas) dos caracteres Unicode?

Em diferentes codificações de Unicode, por exemploUTF-16leouUTF-8, um caractere pode ocupar 2 ou 3 bytes. Muitos aplicativos Unicode não cuidam da largura de exibição dos caracteres Unicode, assim como todas as letras latinas. Por exemplo, ...

3 a resposta

Matching (por exemplo) uma letra Unicode com regexps Java

Há muitas perguntas e respostas aqui no StackOverflow que pressupõem que uma "letra" possa ser correspondida em uma regexp por[a-zA-Z]. No entanto, no Unicode, existem muitos outros caracteres que a maioria das pessoas consideraria uma letra ...

3 a resposta

\ Corresponde a todos os caracteres alfanuméricos definidos no padrão Unicod

Does Perl'\w corresponde a todos os caracteres alfanuméricos definidos no padrão Unicod Por exemplo,\w corresponde a todos (digamos) caracteres alfanuméricos chineses e russos? Eu escrevi um script de teste simples (veja abaixo) que sugere ...

2 a resposta

Como combinar um "nome" Unicode com uma expressão regular JavaScript

Em JavaScript, podemos corresponder pontos de código Unicode individuais ou intervalos de pontos de código usando as sequências de escape Unicode, por exemplo "A".match(/\u0041/) // => ["A"] "B".match(/[\u0041-\u007A]/) // => ["B"]Mas ...

2 a resposta

O que é a categoria Unicode {L}?

Me deparei com algumas expressões regulares que contêm[^\\p{L}]. Entendo que isso esteja usando algum tipo de categoria Unicode, mas quando ...

2 a resposta

Existe uma maneira de combinar qualquer caractere não alfabético Unicode?

Tenho alguns documentos que passaram pela conversão de OCR de PDF para HTML. Por causa disso, eles acabaram tendo muitas pontuações unicode aleatórias onde o conversor estragou (ou seja, elipses, etc ...). Eles também possuem corretamente um ...

3 a resposta

Pesquisando números Unicode em uma string com \ d

De acordo com documentação Oniguruma [http://www.geocities.jp/kosako3/oniguruma/doc/RE.txt], a\d corresponde ao tipo de caractere: decimal digit char Unicode: General_Category - Decimal_Number No entanto, procurando por\d em uma string com ...

2 a resposta

Corrigir apenas uma letra unicode em Python re

Eu tenho uma string da qual quero extrair 3 grupos: '19 janvier 2012' -> '19', 'janvier', '2012'Month name poderia conter caracteres não ASCII, então[A-Za-z] Nao funciona para mim >>> import re >>> re.search(ur'(\d{,2}) ([A-Za-z]+) (\d{4})', ...