Вы также не должны пытаться очистить Google, если у вас более 100 прокси-серверов. Они легко заблокируют ваш IP временно после нескольких попыток.

ли простой способ очистить Google и написать текст (только текст) из первых N (скажем, 1000) .html (или любых других) документов для данного поиска?

Например, представьте, что вы ищете фразу «большой плохой волк» и загружаете только текст из 1000 самых популярных хитов, то есть фактически загружаете текст с этих 1000 веб-страниц (но только с этих страниц, а не со всего сайта).

Я предполагаю, что это будет использовать библиотеку urllib2? Я использую Python 3.1, если это помогает.