Como explicar os caracteres de acentuação para regex em Python?

Question

Sep 06, 2013, 07:48 PM

hashtag regex non-ascii-characters python django

Como explicar os caracteres de acentuação para regex em Python?

Eu atualmente uso re.findall para encontrar e isolar palavras após o caractere '#' para tags hash em uma string:

hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1)

Ele procura str1 e encontra todas as hashtags. Isso funciona, no entanto, não conta para caracteres acentuados como estes, por exemplo:áéíóúñü¿.

Se uma dessas letras estiver em str1, ela salvará a hashtag até a letra anterior. Então, por exemplo,#yogenfrüz seria#yogenfr.

Eu preciso ser capaz de explicar todas as letras acentuadas que variam de alemão, holandês, francês e espanhol, para que eu possa salvar hashtags como#yogenfrüz

Como posso fazer isso?

questionAnswers(2)

Perguntas populares

0 a resposta

Em Java, podemos dividir uma classe em vários arquivos

0 a resposta

array no objetivo c

0 a resposta

É possível integrar o Nodejs ao Cakephp?

0 a resposta

O que é “aplicativo QApplication (argc, argv)” tentando fazer?

0 a resposta

Dinâmica de layout de três colunas DIV; esquerda = fixa, centro = fluido, direita = fluido

Você é muito ativo! É ótimo!

Como explicar os caracteres de acentuação para regex em Python?

questionAnswers(2)

yourAnswerToTheQuestion

Perguntas populares