Resultados da pesquisa a pedido "character-properties"

1 a resposta

Correspondência de traços Unicode em expressões regulares Java?

Estou tentando criar uma expressão regular Java para dividir seqüências de caracteres do formato geral "foo-bar" em "foo" e "bar" usando Pattern.split (). O caractere "-" pode ser um dos vários hífens: o ASCII '-', o traço em-, o traço, etc. Eu ...

1 a resposta

Substituir caracteres de controle Unicode

Preciso substituir todo caractere de controle especial em uma string em Java. Quero perguntar à API do Google Maps v3, e o Google não parece gostar ...

1 a resposta

Regexp Unicode para corresponder a quebras de linha?

Eu tenho este formulário de onde desejo enviar dados para um banco de dados. Os dados são UTF8. Estou tendo problemas com quebras de linha correspondentes. O padrão que estou usando é mais ou menos assim: ~^[\p{L}\p{M}\p{N} ]+$~uEsse padrão ...

2 a resposta

Regex - referência e exemplos de propriedades Unicode

Sinto-me perdido com as propriedades Regex Unicode apresentadas pelo RegexBuddy, não consigo distinguir entre nenhuma das propriedades Number e a propriedade...

2 a resposta

Python e expressão regular com Unicode

Eu preciso excluir alguns símbolos Unicode da string 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Eu sei que eles existem aqui com certeza. Eu tentei: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ ...

2 a resposta

Como combinar um "nome" Unicode com uma expressão regular JavaScript

Em JavaScript, podemos corresponder pontos de código Unicode individuais ou intervalos de pontos de código usando as sequências de escape Unicode, por exemplo "A".match(/\u0041/) // => ["A"] "B".match(/[\u0041-\u007A]/) // => ["B"]Mas ...

2 a resposta

O que é a categoria Unicode {L}?

Me deparei com algumas expressões regulares que contêm[^\\p{L}]. Entendo que isso esteja usando algum tipo de categoria Unicode, mas quando ...

2 a resposta

Existe uma maneira de combinar qualquer caractere não alfabético Unicode?

Tenho alguns documentos que passaram pela conversão de OCR de PDF para HTML. Por causa disso, eles acabaram tendo muitas pontuações unicode aleatórias onde o conversor estragou (ou seja, elipses, etc ...). Eles também possuem corretamente um ...

2 a resposta

Corrigir apenas uma letra unicode em Python re

Eu tenho uma string da qual quero extrair 3 grupos: '19 janvier 2012' -> '19', 'janvier', '2012'Month name poderia conter caracteres não ASCII, então[A-Za-z] Nao funciona para mim >>> import re >>> re.search(ur'(\d{,2}) ([A-Za-z]+) (\d{4})', ...

3 a resposta

Equivalentes Unicode para \ w e \ b em expressões regulares Java?

Muitas implementações modernas de regex interpretam o\w taquigrafia da classe de caracteres como "qualquer letra, dígito ou pontuação de conexão" (geralmente: sublinhado). Dessa forma, uma regex como\w+ combina palavras comohello, élève, GOÄ_432 ...