Agarra los enlaces de imagen del sitio web HTML usando powershell

Question

Apr 07, 2013, 09:09 AM

Agarra los enlaces de imagen del sitio web HTML usando powershell

Me gustaría descargar algunas galerías de imágenes a granel. Las imágenes se ofrecen de forma gratuita sin necesidad de permisos. Yo por mi vida no puedo hacer que funcione. Esto es lo que tengo hasta ahora. El patrón $ spit out es toda la línea HTML, no solo el enlace de la imagen. ¿Hay algún indicador que me puedas dar? El bucle está configurado para ejecutarse solo una vez con fines de prueba. El bucle, pasará por todas las páginas que están organizadas numéricamente.

# Variables
$i=1        # Webpage Counter
$j=1        # Image Counter
$rootDir = "http://website.com/sport/galleries/"
$saveDir = "C:\Users\user\Desktop\"
$webpagetxt = "C:\Users\user\Desktop\page.txt"
$links = "C:\Users\user\Desktop\links.txt"
$regex = "http://website.com/galleries/[0-9]*/[^\.]*.JPG"

# Create folder to download to
#New-Item -Name SiouxSportsGalleries -ItemType directory

# Start Web Client
$client = New-Object System.Net.WebClient

# Main loop to get image links and download
    For($i=10; $i -le 10; $i++){

        # Download source code of the web page.
        $url = $rootDir+$i+'.htm'
        $webclient = new-object System.Net.WebClient
        $webpage = $webclient.DownloadString($url)
        $webpage > "$webpagetxt"

    # Parse web page and find image link.
       $pattern = Get-Content $webpagetxt | Select-String -pattern $regex -Allmatches
       echo "This is the link" $pattern
    #$pattern > $links

 }