Jak rozliczyć znaki akcentujące dla wyrażenia regularnego w Pythonie?

Question

Sep 06, 2013, 07:48 PM

django regex python hashtag non-ascii-characters

Jak rozliczyć znaki akcentujące dla wyrażenia regularnego w Pythonie?

Obecnie używam re.findall do znajdowania i izolowania słów po znaku „#” dla znaczników mieszania w ciągu:

hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1)

Wyszukuje str1 i znajduje wszystkie hashtagi. Działa to jednak nie uwzględnia znaków akcentowanych takich jak na przykład:áéíóúñü¿.

Jeśli jedna z tych liter znajduje się w str1, zapisze hashtag aż do litery przed nim. Na przykład#yogenfrüz byłoby#yogenfr.

Muszę być w stanie rozliczyć wszystkie akcentowane litery, które wahają się od niemieckiego, holenderskiego, francuskiego i hiszpańskiego, dzięki czemu mogę zapisać hashtagi, takie jak#yogenfrüz

Jak mogę to zrobić

questionAnswers(2)

Popularne pytania

0 odpowiedzi

EF Code First Migrations: MigrateDatabaseToLatestVersion bez NUGET

0 odpowiedzi

Kolejka.js do wstępnego ładowania obrazów czeka wiecznie? (Callbak)

0 odpowiedzi

Jak efektywnie korzystać z MySQLDB SScursor?

0 odpowiedzi

dlaczego PyObject * może wskazywać dowolny obiekt w Pythonie?

0 odpowiedzi

„Zapamiętaj mnie” na stronach internetowych asp.net

Jesteś bardzo aktywny! To świetnie!

Jak rozliczyć znaki akcentujące dla wyrażenia regularnego w Pythonie?

questionAnswers(2)

yourAnswerToTheQuestion

Popularne pytania