Как я могу извлечь только текст в селектор Scrapy в Python
У меня есть этот код
site = hxs.select("//h1[@class='state']")
log.msg(str(site[0].extract()),level=log.ERROR)
Выход является
[scrapy] ERROR: <strong>
1</strong>
<span> job containing <strong>php</strong> in <strong>region</strong> paying <strong>$30-40k per year</strong></span>
Можно ли получить только текст без каких-либо тегов HTML