Android Regex Pattern Incode UTF-8

Estou tentando este código no android para capturar (. +?) Com matcher.group (1):

String html = doc.html().toString();

                    Pattern p = Pattern.compile("(?is)caption\"(?is):(?is)\"(.+?)\",(?is)\"",
                            Pattern.DOTALL);
                        Matcher m = p.matcher(html);
                        if (m.find()){
                            text_main = m.group(1);
                        }

mas às vezes não funciona. Eu acho que pode ser causado por incode. tão:

Se eu penso que é verdade, o que posso fazer para esse problema? (Crie regex para utf-8)Se eu estiver errado, o que posso fazer? Estou tentando obter uma string em um objeto json. o código json é colocado em um script em uma página html.