Regex combinando uma palavra com números nela
Estou a usarText::Ngrams
para determinar as combinações de palavras em uma sequência. No entanto, preciso manter as palavras que contêm dígitos. Eu determinei que$o->{tokenrex}
é o que eu preciso modificar, mas não consigo determinar a regex adequada para el
O original éqr/([a-zA-Z]+|(\d+(\.\d+)?|\d*\.\d+)([eE][-+]?\d+)?)/;
mas estou pensando que preciso de algo mais nesse sentido:
qr/([a-zA-Z]+|(?<=\w)(\d+(\.\d+)?|\d*\.\d+)([eE][-+]?\d+)?(?=\w)|(\d+(\.\d+)?|\d*\.\d+)([eE][-+]?\d+)?)/;
Qual deve, se eu estiver lendo regex corretamente, corresponder a qualquer número de caracteres alfa ou um "número" que tenha um caractere de palavra antes e depois dele ou um "número". Só que está dividindo minha "palavra" em tokens separados. A palavra de exemplo com a qual estou trabalhando é " A1X ".
Qualquer apoio seria bom