Onde os mecanismos de pesquisa começam a rastrear?

O que os robôs de mecanismo de pesquisa usam como ponto de partida? É pesquisa de DNS ou eles começam com uma lista fixa de sites conhecidos? Alguma sugestão ou sugestão?