Percorra as páginas da Web e copie dados
Eu criei esse script para uma amiga que percorre um site imobiliário e pega o endereço de e-mail dela (para promoção). O site oferece livremente, mas é inconveniente agarrar um de cada vez. O primeiro script despeja os dados de cada página em um arquivo txt chamado webdump e o segundo extrai os endereços de email do primeiro arquivo txt. Salve cada um deles em um arquivo .vbs separado. Se você deseja testar o script, convém alterar o seguinte para um número menor (quantas páginas são processadas):
Do while i < 1334
O primeiro erro aparece e eu não tenho muita certeza do porquê e o segundo puxa um pouco mais do que apenas os endereços de e-mail e, novamente, não tenho certeza do porquê. Eu não sou um cara vbs altamente qualificado, mas esses problemas não estão relacionados à minha pergunta ... Pergunta na parte inferior ...
set ie = createobject("internetexplorer.application")
Set objShell = CreateObject("WScript.Shell")
Dim i
i = 0
Do while i < 1334
i = i + 1
ie.navigate "http://www.reoagents.net/search-3.php?category=1&firmname=&business=&address=&zip=&phone=&fax=&mobile=&im=&manager=&mail=&www=&reserved_1=&reserved_2=&reserved_3=&filterbyday=ANY&loc_one=&loc_two=&loc_three=&loc_four=&location_text=&page="&i
do until ie.readystate = 4 : wscript.sleep 10: loop
pageText = ie.document.body.innertext
set fso = createobject("scripting.filesystemobject")
set ts = fso.opentextfile("c:\webdump.txt",8,true)
ts.write pageText
ts.close
loop
Wscript.Echo "All site data copied!"
E a segunda peça:
Const ForReading = 1
Const ForWriting = 8
Set objRegEx = CreateObject("VBScript.RegExp")
objRegEx.Pattern = "@"
Set objFSO = CreateObject("Scripting.FileSystemObject")
'Input file
Set objFileIn = objFSO.OpenTextFile("C:\webdump.txt", ForReading)
strOutputFile = "C:\cleanaddress.txt"
Do Until objFileIn.AtEndOfStream
strSearchString = objFileIn.ReadLine
Set colMatches = objRegEx.Execute(strSearchString)
If colMatches.Count > 0 Then
For Each strMatch in colMatches
' Output File
Set objFileOut = objFSO.OpenTextFile(strOutputFile, ForWriting, True)
IF InStr(strSearchString," ") = 0 THEN
objFileOut.writeline strSearchString
ELSE
objFileOut.writeline Left(strSearchString,InStr(strSearchString," ")-1)
END IF
objFileOut.Close
Set objFileOut = Nothing
Next
End If
Loop
objFileIn.Close
Wscript.Echo "Done!"
Sou capaz de percorrer as páginas desse site facilmente por causa da maneira como o endereço é ... o último número de endereço é seqüencial, no entanto, agora quero experimentá-lo com este endereço:
que parece ser baseado em java. Quando clico em cada página, o endereço não muda. É possível fazer algo semelhante ao que eu fiz no outro site nesse caso?