Как учесть символы ударения для регулярных выражений в Python?

Question

Sep 06, 2013, 07:48 PM

django non-ascii-characters regex hashtag python

Как учесть символы ударения для регулярных выражений в Python?

В настоящее время я использую re.findall для поиска и выделения слов после символа '#' для хэш-тегов в строке:

hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1)

Он ищет str1 и находит все хэштеги. Это работает, однако, это не учитывает акцентированные символы, такие как эти, например:áéíóúñü¿.

Если одна из этих букв находится в str1, она сохранит хэштегом до буквы перед ней. Так, например,#yogenfrüz было бы#yogenfr.

Я должен быть в состоянии учесть все акцентированные буквы, которые варьируются от немецкого, голландского, французского и испанского языков, чтобы я мог сохранять такие хэштеги#yogenfrüz

Как я могу сделать это

Как учесть символы ударения для регулярных выражений в Python?

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как учесть символы ударения для регулярных выражений в Python?

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы