usando python nltk para encontrar semelhança entre duas páginas da we

Quero descobrir se duas páginas da web são semelhantes ou não. Alguém pode sugerir se python nltk com funções de similaridade wordnet útil e como? Qual é a melhor função de similaridade a ser usada neste caso?