Jak rozliczyć znaki akcentujące dla wyrażenia regularnego w Pythonie?
Obecnie używam re.findall do znajdowania i izolowania słów po znaku „#” dla znaczników mieszania w ciągu:
hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1)
Wyszukuje str1 i znajduje wszystkie hashtagi. Działa to jednak nie uwzględnia znaków akcentowanych takich jak na przykład:áéíóúñü¿
.
Jeśli jedna z tych liter znajduje się w str1, zapisze hashtag aż do litery przed nim. Na przykład#yogenfrüz
byłoby#yogenfr
.
Muszę być w stanie rozliczyć wszystkie akcentowane litery, które wahają się od niemieckiego, holenderskiego, francuskiego i hiszpańskiego, dzięki czemu mogę zapisać hashtagi, takie jak#yogenfrüz
Jak mogę to zrobić