Regex für Unicode in Großbuchstaben stimmt nicht mit "Ó" überein?
Es scheint, dass es den Akzent nicht als Großbuchstaben erkennt
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
kehrt zurück
SIM
Perl sollte in der Lage sein, Unicode-Daten zu verwenden, die Ó bereits als Großbuchstaben kennzeichnen. Von Emacsdescribe-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')