Resultados da pesquisa a pedido "character-properties"

3 a resposta

Caracteres de letra Unicode correspondentes no PCRE / PHP

Estou tentando escrever um validador razoavelmente permissivo para nomes em PHP, e minha primeira tentativa consiste no seguinte padrão: // unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/";Eventualmente, isso é ...

3 a resposta

Matching (por exemplo) uma letra Unicode com regexps Java

Há muitas perguntas e respostas aqui no StackOverflow que pressupõem que uma "letra" possa ser correspondida em uma regexp por[a-zA-Z]. No entanto, no Unicode, existem muitos outros caracteres que a maioria das pessoas consideraria uma letra ...

5 a resposta

Como saber a largura de exibição preferida (em colunas) dos caracteres Unicode?

Em diferentes codificações de Unicode, por exemploUTF-16leouUTF-8, um caractere pode ocupar 2 ou 3 bytes. Muitos aplicativos Unicode não cuidam da largura de exibição dos caracteres Unicode, assim como todas as letras latinas. Por exemplo, ...

6 a resposta

Regex do Python que combina propriedades Unicode

O Perl e alguns outros mecanismos de regex atuais suportam propriedades Unicode, como a categoria, em um regex. Por exemplo. em Perl você pode usar

2 a resposta

Existe uma maneira de combinar qualquer caractere não alfabético Unicode?

Tenho alguns documentos que passaram pela conversão de OCR de PDF para HTML. Por causa disso, eles acabaram tendo muitas pontuações unicode aleatórias onde o conversor estragou (ou seja, elipses, etc ...). Eles também possuem corretamente um ...

3 a resposta

Pesquisando números Unicode em uma string com \ d

De acordo com documentação Oniguruma [http://www.geocities.jp/kosako3/oniguruma/doc/RE.txt], a\d corresponde ao tipo de caractere: decimal digit char Unicode: General_Category - Decimal_Number No entanto, procurando por\d em uma string com ...

1 a resposta

Correspondência de traços Unicode em expressões regulares Java?

Estou tentando criar uma expressão regular Java para dividir seqüências de caracteres do formato geral "foo-bar" em "foo" e "bar" usando Pattern.split (). O caractere "-" pode ser um dos vários hífens: o ASCII '-', o traço em-, o traço, etc. Eu ...

2 a resposta

Python e expressão regular com Unicode

Eu preciso excluir alguns símbolos Unicode da string 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Eu sei que eles existem aqui com certeza. Eu tentei: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ ...

2 a resposta

Regex - referência e exemplos de propriedades Unicode

Sinto-me perdido com as propriedades Regex Unicode apresentadas pelo RegexBuddy, não consigo distinguir entre nenhuma das propriedades Number e a propriedade...

3 a resposta

Equivalentes Unicode para \ w e \ b em expressões regulares Java?

Muitas implementações modernas de regex interpretam o\w taquigrafia da classe de caracteres como "qualquer letra, dígito ou pontuação de conexão" (geralmente: sublinhado). Dessa forma, uma regex como\w+ combina palavras comohello, élève, GOÄ_432 ...