Resultados da pesquisa a pedido "character-properties"
Caracteres de letra Unicode correspondentes no PCRE / PHP
Estou tentando escrever um validador razoavelmente permissivo para nomes em PHP, e minha primeira tentativa consiste no seguinte padrão: // unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/";Eventualmente, isso é ...
Matching (por exemplo) uma letra Unicode com regexps Java
Há muitas perguntas e respostas aqui no StackOverflow que pressupõem que uma "letra" possa ser correspondida em uma regexp por[a-zA-Z]. No entanto, no Unicode, existem muitos outros caracteres que a maioria das pessoas consideraria uma letra ...
Como saber a largura de exibição preferida (em colunas) dos caracteres Unicode?
Em diferentes codificações de Unicode, por exemploUTF-16leouUTF-8, um caractere pode ocupar 2 ou 3 bytes. Muitos aplicativos Unicode não cuidam da largura de exibição dos caracteres Unicode, assim como todas as letras latinas. Por exemplo, ...
Regex do Python que combina propriedades Unicode
O Perl e alguns outros mecanismos de regex atuais suportam propriedades Unicode, como a categoria, em um regex. Por exemplo. em Perl você pode usar
Existe uma maneira de combinar qualquer caractere não alfabético Unicode?
Tenho alguns documentos que passaram pela conversão de OCR de PDF para HTML. Por causa disso, eles acabaram tendo muitas pontuações unicode aleatórias onde o conversor estragou (ou seja, elipses, etc ...). Eles também possuem corretamente um ...
Pesquisando números Unicode em uma string com \ d
De acordo com documentação Oniguruma [http://www.geocities.jp/kosako3/oniguruma/doc/RE.txt], a\d corresponde ao tipo de caractere: decimal digit char Unicode: General_Category - Decimal_Number No entanto, procurando por\d em uma string com ...
Correspondência de traços Unicode em expressões regulares Java?
Estou tentando criar uma expressão regular Java para dividir seqüências de caracteres do formato geral "foo-bar" em "foo" e "bar" usando Pattern.split (). O caractere "-" pode ser um dos vários hífens: o ASCII '-', o traço em-, o traço, etc. Eu ...
Python e expressão regular com Unicode
Eu preciso excluir alguns símbolos Unicode da string 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Eu sei que eles existem aqui com certeza. Eu tentei: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ ...
Regex - referência e exemplos de propriedades Unicode
Sinto-me perdido com as propriedades Regex Unicode apresentadas pelo RegexBuddy, não consigo distinguir entre nenhuma das propriedades Number e a propriedade...
Equivalentes Unicode para \ w e \ b em expressões regulares Java?
Muitas implementações modernas de regex interpretam o\w taquigrafia da classe de caracteres como "qualquer letra, dígito ou pontuação de conexão" (geralmente: sublinhado). Dessa forma, uma regex como\w+ combina palavras comohello, élève, GOÄ_432 ...
Página 1 do 2