Como posso adivinhar a codificação de uma string em Perl?
Eu tenho uma string Unicode e não sei qual é a sua codificação. Quando esta string é lida por um programa Perl, existe uma codificação padrão que o Perl usará? Se sim, como posso descobrir o que é?
Eu estou tentando se livrar de caracteres não-ASCII da entrada. Eu encontrei isso em algum fórum que vai fazer isso:
my $line = encode('ascii', normalize('KD', $myutf), sub {$_[0] = ''});
Como o trabalho acima funcionará quando nenhuma codificação de entrada for especificada? Deveria ser especificado como o seguinte?
my $line = encode('ascii', normalize('KD', decode($myutf, 'input-encoding'), sub {$_[0] = ''});