Android org.xmlpull.v1.XmlPullParserException при анализе XML
У меня есть ситуация, когда я вызываю веб-сервис, и он возвращает мне немного HTML в конверте XML. лайк:
<code><xml version="1.0" cache="false"> <head/> <body> <table> <tr> <td> <a href="link-to-prev-post"> <text color="red"><< Prev</text> </a> </td> <td> <a href="link-to-next-post"> <text color="red">| Next >></text> </a> </td> </tr> </table> </body> </xml> </code>
Я должен получитьlink-to-prev-post & Амп;link-to-next-post ссылки .. так что я могу получить больше данных через эти ссылки.
я используюXmlPullParser проанализировать предоставленный выше XML / HTML. Чтобы получить ссылки для следующих / предыдущих элементов, я делаю следующее:
<code>if (xmlNodeName.equalsIgnoreCase("a")) { link = parser.getAttributeValue(null, "href"); } else if (xmlNodeName.equalsIgnoreCase("text")) { color = parser.getAttributeValue(null, "color"); if (color.equalsIgnoreCase("red") && parser.getEventType() == XmlPullParser.START_TAG) { // check for next/prev blog entries links // but this parser.nextText() throws XmlPullParserException // i think because the nextText() returns << Prev which the parser considers to be wrong String innerText = parser.nextText(); if (innerText.contains("<< Prev")) { blog.setPrevBlogItemsUrl(link); } else if (innerText.contains("Next >>")) { blog.setNextBlogItemsUrl(link); } } link = null; } } </code>
Это бросаетXmlPullParserException на исполнениеparser.nextText() ... и значение текстового элемента в это время<< Prev .. я думаю, что это неправильно понимает это значение с тегом начала из-за присутствия<< в тексте..
LogCat подробно это:
<code>04-08 18:32:09.827: W/System.err(688): org.xmlpull.v1.XmlPullParserException: precondition: START_TAG (position:END_TAG </text>@9:2535 in java.io.InputStreamReader@44c6d0d8) 04-08 18:32:09.827: W/System.err(688): at org.kxml2.io.KXmlParser.exception(KXmlParser.java:245) 04-08 18:32:09.827: W/System.err(688): at org.kxml2.io.KXmlParser.nextText(KXmlParser.java:1382) 04-08 18:32:09.827: W/System.err(688): at utilities.XMLParserHelper.parseBlogEntries(XMLParserHelper.java:139) 04-08 18:32:09.827: W/System.err(688): at serviceclients.PlayerSummaryAsyncTask.doInBackground(PlayerSummaryAsyncTask.java:68) 04-08 18:32:09.827: W/System.err(688): at serviceclients.PlayerSummaryAsyncTask.doInBackground(PlayerSummaryAsyncTask.java:1) 04-08 18:32:09.836: W/System.err(688): at android.os.AsyncTask$2.call(AsyncTask.java:185) 04-08 18:32:09.836: W/System.err(688): at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:305) 04-08 18:32:09.836: W/System.err(688): at java.util.concurrent.FutureTask.run(FutureTask.java:137) 04-08 18:32:09.836: W/System.err(688): at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1068) 04-08 18:32:09.836: W/System.err(688): at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:561) 04-08 18:32:09.836: W/System.err(688): at java.lang.Thread.run(Thread.java:1096) </code>
Я надеюсь, что я прояснил свою проблему.
SolutionНе вдохновленMartin & APOS; s Подход к преобразованию полученных данных сначала в строку, я решил свою проблему в виде смешанного подхода.
Convert the received InputStream's value to string and replaced the erroneous characters with * (or whatever you wish) : as follows
<code>InputStreamReader isr = new InputStreamReader(serviceReturnedStream); BufferedReader br = new BufferedReader(isr); StringBuilder xmlAsString = new StringBuilder(512); String line; try { while ((line = br.readLine()) != null) { xmlAsString.append(line.replace("<<", "*").replace(">>", "*")); } } catch (IOException e) { e.printStackTrace(); } </code>
Now i have a string which contains correct XML data (for my case), so just use the normal XmlPullParser to parse it instead of manually parsing it myself:
<code>XmlPullParserFactory factory = XmlPullParserFactory.newInstance(); factory.setNamespaceAware(false); XmlPullParser parser = factory.newPullParser(); parser.setInput(new StringReader(xmlAsString.toString())); </code>
Надеюсь, это поможет кому-то!