Regex для прописных букв Unicode не соответствует «Ó»?
Кажется, он не распознает акцентированный & # xD3; в верхнем регистре
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
возвращается
SIM
Perl должен иметь возможность использовать данные Unicode, которые уже помечают теги & # xD3; в верхнем регистре.
Из Emacsdescribe-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')