Algoritmo Web Cralwer: profundidade?
Estou trabalhando em um rastreador e preciso entender exatamente o que se entende por "profundidade do link". Tome nutch, por exemplo:http://wiki.apache.org/nutch/NutchTutorial
depth indica a profundidade do link da página raiz que deve ser rastreada.
Então, digamos que eu tenho o domíniowww.domain.com
e queria rastrear uma profundidade de, digamos,3
-- o que eu preciso fazer? Se um site pudesse ser representado como uma árvore binária, acho que não seria um problema.