Agarre os links de imagem do site HTML usando o PowerShell
Gostaria de baixar algumas galerias de imagens em massa. As imagens são oferecidas gratuitamente sem permissões necessárias. Eu, pela vida de mim, não posso fazê-lo funcionar. Isso é o que eu tenho até agora. O padrão $ spit out é toda a linha HTML, não apenas o link da imagem. Existe alguma ponteira que você possa me dar? O loop é definido para ser executado apenas uma vez para fins de teste. O loop percorrerá todas as páginas organizadas numericamente.
# Variables
$i=1 # Webpage Counter
$j=1 # Image Counter
$rootDir = "http://website.com/sport/galleries/"
$saveDir = "C:\Users\user\Desktop\"
$webpagetxt = "C:\Users\user\Desktop\page.txt"
$links = "C:\Users\user\Desktop\links.txt"
$regex = "http://website.com/galleries/[0-9]*/[^\.]*.JPG"
# Create folder to download to
#New-Item -Name SiouxSportsGalleries -ItemType directory
# Start Web Client
$client = New-Object System.Net.WebClient
# Main loop to get image links and download
For($i=10; $i -le 10; $i++){
# Download source code of the web page.
$url = $rootDir+$i+'.htm'
$webclient = new-object System.Net.WebClient
$webpage = $webclient.DownloadString($url)
$webpage > "$webpagetxt"
# Parse web page and find image link.
$pattern = Get-Content $webpagetxt | Select-String -pattern $regex -Allmatches
echo "This is the link" $pattern
#$pattern > $links
}