Android Regex Pattern Incode UTF-8
Estoy intentando este código en Android para capturar (. +?) Con matcher.group (1):
String html = doc.html().toString();
Pattern p = Pattern.compile("(?is)caption\"(?is):(?is)\"(.+?)\",(?is)\"",
Pattern.DOTALL);
Matcher m = p.matcher(html);
if (m.find()){
text_main = m.group(1);
}
Pero a veces no funciona. Creo que puede ser causado por incode. entonces:
Si lo considero cierto, ¿qué puedo hacer para este problema? (Hacer regex para utf-8)Si me equivoco, ¿qué puedo hacer? Estoy tratando de obtener una cadena en un objeto json. el código json se coloca en un script en una página html.