Tentando analisar links em uma listagem de diretório HTML usando Java

Por favor, alguém pode me ajudar a analisar esses links de uma página HTML

http: //nemertes.lis.upatras.gr/dspace/handle/123456789/229http: //nemertes.lis.upatras.gr/dspace/handle/123456789/315http: //nemertes.lis.upatras.gr/dspace/handle/123456789/315

Eu quero analisar usando o "lidar co "palavra comum nesses links.

Estou usando o comando[Pattern pattern = Pattern.compile("<a.+href=\"(.+?)\"");] mas me analisa todo ohref links da página.

Alguma sugestão
Obrigad

questionAnswers(2)

yourAnswerToTheQuestion