¿Regex para Unicode en mayúsculas no coincide con "Ó"?
Parece que no reconoce el acento Ó como mayúscula
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
devoluciones
SIM
Perl debería poder usar los datos de Unicode, que ya están etiquetados, como mayúsculas. De emacsdescribe-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')