Ao validar com XSD, encontre o elemento exato que falta no XML usando qualquer um dos analisadores DOM, StAX, SAX

Eu tenho um arquivo XML e seu arquivo XSD correspondente. Ao validar usando o analisador StAX, anexei um manipulador de erros. Basicamente, encontro dois tipos de erros em um arquivo XML bem formado.

1) Tipo de dados incorreto dentro de um elemento, por exemplo, string dentro de um elemento que deveria ter um número inteiro.

2) Elemento ausente: um elemento que deve estar presente de acordo com o XSD não está presente no XML.

Usando um analisador StAX e um manipulador de erros personalizado, sou capaz de corrigir o primeiro tipo de erro. Mas para o segundo tipo, um evento CHARACTER é acionado e o valor do TEXT é o valor do próximo elemento imediato. Não sei como descobrir o elemento que falta. Além disso, por que o evento CHARACTER é acionado e o elemento ausente é completamente ignorado?

Como o analisador StAX é apenas encaminhado, existe uma maneira de corrigir os dois erros usando outros analisadores?

import java.io.File;
import java.io.IOException;
import javax.xml.XMLConstants;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.XMLStreamReader;
import javax.xml.transform.stax.StAXSource;
import javax.xml.transform.stream.StreamSource;
import javax.xml.validation.*;
import javax.xml.validation.Validator;
import org.xml.sax.ErrorHandler;
import org.xml.sax.SAXException;
import org.xml.sax.SAXParseException;

public class XMLValidation {

    public static void main(String[] args) {

        XMLValidation xmlValidation = new XMLValidation();
        System.out.println(xmlValidation.validateXMLSchema("PHSHumanSubjectsAndClinicalTrialsInfo-V1.0.xsd", "FullPHSHuman.xml"));
    }

    public boolean validateXMLSchema(String xsdPath, String xmlPath){

        try {
            SchemaFactory factory = SchemaFactory.newInstance(XMLConstants.W3C_XML_SCHEMA_NS_URI);
            Schema schema = factory.newSchema(new File(xsdPath));
            StreamSource XML = new StreamSource(xmlPath);
            XMLStreamReader reader = XMLInputFactory.newFactory().createXMLStreamReader(XML);
            Validator validator = schema.newValidator();
            validator.setErrorHandler(new MyErrorHandler(reader));
            validator.validate(new StAXSource(reader));
        } catch (IOException | SAXException | XMLStreamException e) {
            System.out.println("Exception: "+e.getMessage() + " local message " + e.getLocalizedMessage() + " cause " + e.getCause());
            return false;
        }
        return true;
    }
}

class MyErrorHandler implements ErrorHandler {

    private XMLStreamReader reader;

    public MyErrorHandler(XMLStreamReader reader) {
        this.reader = reader;
    }

    @Override
    public void error(SAXParseException e) throws SAXException {
        System.out.println("error");
        warning(e);
    }

    @Override
    public void fatalError(SAXParseException e) throws SAXException {
        System.out.println("fatal error");
        warning(e);
    }

    @Override
    public void warning(SAXParseException e) throws SAXException {
        if(reader.getEventType() == 1 || reader.getEventType() == 2) {
            //The first type of error is detected here.
            System.out.println(reader.getLocalName());
            System.out.println(reader.getNamespaceURI());

        }

        if(reader.getEventType() == XMLStreamConstants.CHARACTERS) {
            int start = reader. getTextStart();
            int length = reader.getTextLength();
            System.out.println(new String(reader.getTextCharacters(), start, length));
        }
    }
}

Abaixo está o trecho do arquivo XML bem formado:

<?xml version="1.0" encoding="UTF-8"?>
<PHSHumanSubjectsAndClinicalTrialsInfo:PHSHumanSubjectsAndClinicalTrialsInfo xmlns:PHSHumanSubjectsAndClinicalTrialsInfo="http://apply.grants.gov/forms/PHSHumanSubjectsAndClinicalTrialsInfo-V1.0" PHSHumanSubjectsAndClinicalTrialsInfo:FormVersion="1.0"
>
<!--    <PHSHumanSubjectsAndClinicalTrialsInfo:HumanSubjectsIndicator
    >Y: </PHSHumanSubjectsAndClinicalTrialsInfo:HumanSubjectsIndicator
    >-->
    <PHSHumanSubjectsAndClinicalTrialsInfo:HumanSubjectsIndicator1
    >Y: Yes</PHSHumanSubjectsAndClinicalTrialsInfo:HumanSubjectsIndicator1
    >
    <PHSHumanSubjectsAndClinicalTrialsInfo:HumanSubjectsIndicator2
    >Y: Yes</PHSHumanSubjectsAndClinicalTrialsInfo:HumanSubjectsIndicator2
    >

Aqui, o elemento HumanSubjectsIndicator é comentado para provocar o segundo cenário. Nesse caso, um evento CHARACTER é acionado no 'MyErrorHandler'. O valor 'Y: Sim' é obtido reader.getTextCharacters (). Este valor corresponde ao elemento HumanSubjectsIndicator1 (encontrado usando o método getLocation ()).

Existe uma maneira de obter exatamente o nome local do elemento ausente. Se não estiver usando o StAX, use outros analisadores?

Obrigado.

questionAnswers(1)

yourAnswerToTheQuestion