Resultados da pesquisa a pedido "character-properties"
Correspondência de traços Unicode em expressões regulares Java?
Estou tentando criar uma expressão regular Java para dividir seqüências de caracteres do formato geral "foo-bar" em "foo" e "bar" usando Pattern.split (). O caractere "-" pode ser um dos vários hífens: o ASCII '-', o traço em-, o traço, etc. Eu ...
Substituir caracteres de controle Unicode
Preciso substituir todo caractere de controle especial em uma string em Java. Quero perguntar à API do Google Maps v3, e o Google não parece gostar ...
Regexp Unicode para corresponder a quebras de linha?
Eu tenho este formulário de onde desejo enviar dados para um banco de dados. Os dados são UTF8. Estou tendo problemas com quebras de linha correspondentes. O padrão que estou usando é mais ou menos assim: ~^[\p{L}\p{M}\p{N} ]+$~uEsse padrão ...
Regex - referência e exemplos de propriedades Unicode
Sinto-me perdido com as propriedades Regex Unicode apresentadas pelo RegexBuddy, não consigo distinguir entre nenhuma das propriedades Number e a propriedade...
Python e expressão regular com Unicode
Eu preciso excluir alguns símbolos Unicode da string 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Eu sei que eles existem aqui com certeza. Eu tentei: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ ...
Como combinar um "nome" Unicode com uma expressão regular JavaScript
Em JavaScript, podemos corresponder pontos de código Unicode individuais ou intervalos de pontos de código usando as sequências de escape Unicode, por exemplo "A".match(/\u0041/) // => ["A"] "B".match(/[\u0041-\u007A]/) // => ["B"]Mas ...
O que é a categoria Unicode {L}?
Me deparei com algumas expressões regulares que contêm[^\\p{L}]. Entendo que isso esteja usando algum tipo de categoria Unicode, mas quando ...
Existe uma maneira de combinar qualquer caractere não alfabético Unicode?
Tenho alguns documentos que passaram pela conversão de OCR de PDF para HTML. Por causa disso, eles acabaram tendo muitas pontuações unicode aleatórias onde o conversor estragou (ou seja, elipses, etc ...). Eles também possuem corretamente um ...
Corrigir apenas uma letra unicode em Python re
Eu tenho uma string da qual quero extrair 3 grupos: '19 janvier 2012' -> '19', 'janvier', '2012'Month name poderia conter caracteres não ASCII, então[A-Za-z] Nao funciona para mim >>> import re >>> re.search(ur'(\d{,2}) ([A-Za-z]+) (\d{4})', ...
Equivalentes Unicode para \ w e \ b em expressões regulares Java?
Muitas implementações modernas de regex interpretam o\w taquigrafia da classe de caracteres como "qualquer letra, dígito ou pontuação de conexão" (geralmente: sublinhado). Dessa forma, uma regex como\w+ combina palavras comohello, élève, GOÄ_432 ...
Página 1 do 2