Posix совсем мертв, пусть он будет разбит на куски.

я есть программа VB.NET, которая обрабатывает содержимое документов. Программа обрабатывает большие объемы документов как «пакетные» (> 2 миллиона документов; общий объем 1 ТБ). Некоторые из этих документов могут содержать контрольные символы или символы типа f0e8 (http://www.fileformat.info/info/unicode/char/f0e8 /browsertest.htm).

Есть ли легкий и особеннобыстрый способ удалить эти символы? (кроме пробела, новой строки, табуляции, ...) Если ответ регулярное выражение: есть кто-нибудьполный регулярное выражение для меня?

Спасибо!

Ответы на вопрос(0)

Ваш ответ на вопрос