Regex na wielkie litery Unicode nie pasuje do „Ó”?
Wygląda na to, że nie rozpoznaje akcentowanego - jako wielkiego
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
zwraca
SIM
Perl powinien być w stanie używać danych Unicode, które już znaczą - jako wielkie litery. Od emacsadescribe-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')