Emoji Unicode Range von arabischen Tweets mit Java ersetzen
Ich versuche, Emoji aus arabischen Tweets mit Java zu ersetzen.
Ich habe diesen Code benutzt:
String line = "اييه تقولي اجل الارسنال تعادل امس بعد ما كان فايز ";
Pattern unicodeOutliers = Pattern.compile("([\u1F601-\u1F64F])", Pattern.UNICODE_CASE | Pattern.CANON_EQ | Pattern.CASE_INSENSITIVE);
Matcher unicodeOutlierMatcher = unicodeOutliers.matcher(line);
line = unicodeOutlierMatcher.replaceAll(" $1 ");
Aber es ersetzt sie nicht. Auch wenn ich nur mit dem Zeichen "\ u1F602" übereinstimme, wird es nicht ersetzt. Kann sein, weil es 5 Ziffern nach dem u ist ?! Ich bin nicht sicher, nur eine Vermutung.
Beachten Sie, dass
1- die Emotion am Ende des Tweets () ist das "U + 1F602", das "Gesicht mit Freudentränen" ist
2- Diese Frage ist kein Duplikat fürdiese Frag.
Irgendwelche Ideen