Como faço para extrair informações de uma página da web?
Eu quero coletar alguns dados da primeira página de um site. Posso percorrer facilmente cada linha e é apenas uma específica em que estou interessado. Por isso, quero identificar a linha correta e extrair o número, neste caso 324. Como posso fazer isso?
<h2><a href="/mmp/it/su/">Weather</a></h2> <span class="jix_channels_count">(324)</span><br><p class="jix_channels_desc">Progør, su, siør, tester</p>