Tipo de conteúdo válido para documentos XML, HTML e XHTML

Quais são os tipos de conteúdo corretos para documentos XML, HTML e XHTML?

Preciso escrever um rastreador simples que apenas busque esses tipos de arquivos.

Hoje em diahttp://example.net/index.html pode servir, por exemplo, um arquivo JPEG devido a mod_rewrite, por isso preciso verificar o tipo de conteúdo do cabeçalho de resposta e compará-lo com uma lista de tipos de conteúdo permitidos.

De onde posso obter essa lista?

questionAnswers(1)

yourAnswerToTheQuestion