Удалите непечатаемые символы utf8, кроме контроллеров, из строки
У меня есть строка, содержащая текст, управляющие символы, цифры, умляуты (немецкий) и другие символы utf8.
Я хочу убрать все символы utf8, которые не являются «частью языка». Специальные символы, такие как (неполный список) ": / \ ßä,; \ n \ t" должны быть сохранены.
К сожалению, stackoverflow удаляет все эти символы, поэтому я должен добавить изображение (ссылка).
Есть идеи? Помощь очень ценится!
PS: Если бы кто-нибудь знал службу вставки, которая не убивает эти специальные символы, я бы с удовольствием загрузил строки ... Я просто не смог найти одну ..
[Редактировать]: Я думаю, регулярное выражение "\ P {Cc}" - это все символы, которые я хочу сохранить. Может ли это регулярное выражение быть инвертировано, чтобы все символы, не соответствующие этому регулярному выражению, были возвращены?