Удалить все не-«символы слова» из строки в Java, оставив акцентированные символы?
По-видимому, Java-вкус Regex учитывает умлауты и другие специальные символы как не-слова, когда я использую Regex.
"TESTÜTEST".replaceAll( "\\W", "" )
возвращает "ТЕСТТЕСТ" для меня. То, что я хочу, это удалить только все по-настоящему не «слова». Любой способ сделать это, не имея что-то вроде
"[^A-Za-z0-9äöüÄÖÜßéèáàúùóò]"
только чтобы понять, что я забыл?