Удаление акцентов / диакритических знаков из строки при сохранении других специальных символов (пробовал mb_chars.normalize и iconv)
Есть очень похожий вопрос уже. Одно из решений использует такой код:
string.mb_chars.normalize(:kd).gsub(/[^x00-\x7F]/n, '').to_s
Который творит чудеса, пока вы не заметите, что он также удаляет пробелы, точки, тире и кто знает, что еще.
Я не совсем уверен, как работает первый код, но можно ли его раздетьтольк акценты? Или, по крайней мере, дать список символов для сохранения? Мои знания о регулярных выражениях невелики, но я пытался (безрезультатно):
/[^\-x00-\x7F]/n # So it would leave the dash alone
Я собираюсь сделать что-то вроде этого:
string.mb_chars.normalize(:kd).gsub('-', '__DASH__').gsub
(/[^x00-\x7F]/n, '').gsub('__DASH__', '-').to_s
Atrocious? Да..
Я тоже пробовал:
iconv = Iconv.new('UTF-8', 'US-ASCII//TRANSLIT') # Also tried ISO-8859-1
iconv.iconv 'Café' # Throws an error: Iconv::IllegalSequence: "é"
Помоги пожалуйста