Удалить пунктуацию из строк в формате Unicode

Question

Jul 06, 2014, 06:54 PM

Удалить пунктуацию из строк в формате Unicode

У меня есть функция, которая удаляет пунктуацию из списка строк:

def strip_punctuation(input):
    x = 0
    for word in input:
        input[x] = re.sub(r'[^A-Za-z0-9 ]', "", input[x])
        x += 1
    return input

Недавно я изменил свой сценарий, чтобы использовать строки Unicode, чтобы я мог обрабатывать другие не западные символы. Эта функция прерывается, когда встречает эти специальные символы, и просто возвращает пустые строки Unicode. Как я могу надежно удалить пунктуацию из строк в формате Unicode?

Удалить пунктуацию из строк в формате Unicode

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Удалить пунктуацию из строк в формате Unicode

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы