Android Regex Pattern Incode UTF-8

Estoy intentando este código en Android para capturar (. +?) Con matcher.group (1):

String html = doc.html().toString();

                    Pattern p = Pattern.compile("(?is)caption\"(?is):(?is)\"(.+?)\",(?is)\"",
                            Pattern.DOTALL);
                        Matcher m = p.matcher(html);
                        if (m.find()){
                            text_main = m.group(1);
                        }

Pero a veces no funciona. Creo que puede ser causado por incode. entonces:

Si lo considero cierto, ¿qué puedo hacer para este problema? (Hacer regex para utf-8)Si me equivoco, ¿qué puedo hacer? Estoy tratando de obtener una cadena en un objeto json. el código json se coloca en un script en una página html.