Obter a data da última modificação da página usando Java
Existe uma maneira padrão de saber quando uma página foi modificada pela última vez? Atualmente estou fazendo isso:
URLConnection uCon = url.openConnection();
uCon.setConnectTimeout(5000); // 5 seconds
String lastMod = uCon.getHeaderField("Last-Modified");
System.out.println("last mod: "+lastMod);
No entanto, parece que alguns sites não têm umLast-Modified
campo.
http://www.cbc.ca possui estes campos de cabeçalho:
X-Origin-Server
Connection
Expires
null
Date
Server
Content-Type
Transfer-Encoding
Cache-Control
Eu poderia analisar uma página para tentar obter sua data, mas isso parece uma grande dor. Qual é o padrão?
(Se possível, eu gostaria de usar o URLConnection, porque é isso que eu uso para baixar a página da web)