Как учесть символы ударения для регулярных выражений в Python?
В настоящее время я использую re.findall для поиска и выделения слов после символа '#' для хэш-тегов в строке:
hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1)
Он ищет str1 и находит все хэштеги. Это работает, однако, это не учитывает акцентированные символы, такие как эти, например:áéíóúñü¿
.
Если одна из этих букв находится в str1, она сохранит хэштегом до буквы перед ней. Так, например,#yogenfrüz
было бы#yogenfr
.
Я должен быть в состоянии учесть все акцентированные буквы, которые варьируются от немецкого, голландского, французского и испанского языков, чтобы я мог сохранять такие хэштеги#yogenfrüz
Как я могу сделать это