Entfernen Sie nicht druckbare Nicht-ASCII-Zeichen aus einem String
Ich erhalte Benutzereingaben, die Nicht-ASCII-Zeichen und nicht druckbare Zeichen enthalten, z
\xc2d
\xa0
\xe7
\xc3\ufffdd
\xc3\ufffdd
\xc2\xa0
\xc3\xa7
\xa0\xa0
zum Beispiel:
email : [email protected]\xa0\xa0
street : 123 Main St.\xc2\xa0
gewünschte Leistung:
email : [email protected]
street : 123 Main St.
Was ist der beste Weg, um sie mit Java zu entfernen?
Ich habe Folgendes versucht, aber es scheint nicht zu funktionieren
public static void main(String args[]) throws UnsupportedEncodingException {
String s = "abc@gmail\\xe9.com";
String email = "[email protected]\\xa0\\xa0";
System.out.println(s.replaceAll("\\P{Print}", ""));
System.out.println(email.replaceAll("\\P{Print}", ""));
}
Ausgabe
abc@gmail\xe9.com
[email protected]\xa0\xa0