Android Regex Pattern Incode UTF-8

Ich versuche diesen Code in Android, um (. +?) Mit matcher.group (1) abzufangen:

String html = doc.html().toString();

                    Pattern p = Pattern.compile("(?is)caption\"(?is):(?is)\"(.+?)\",(?is)\"",
                            Pattern.DOTALL);
                        Matcher m = p.matcher(html);
                        if (m.find()){
                            text_main = m.group(1);
                        }

aber manchmal klappt es nicht. Ich denke, es kann durch Incode verursacht werden. so

Wenn ich für wahr halte, was kann ich für dieses Problem tun? (Make regex for utf-8)Wenn ich mich irre, was kann ich dann tun? Ich versuche, einen String in ein JSON-Objekt zu bekommen. Der JSON-Code wird in ein Skript auf einer HTML-Seite eingefügt.