Como renderizar o conteúdo de uma tag em unicode no BeautifulSou
Esta é uma sopa de uma página de detalhes da postagem do WordPress:
content = soup.body.find('div', id=re.compile('post'))
title = content.h2.extract()
item['title'] = unicode(title.string)
item['content'] = u''.join(map(unicode, content.contents))
Eu quero omitir odiv
ao atribuiritem['content']
. Existe alguma maneira de renderizar todas as tags filho de uma tag no unicode? Algo como
item['content'] = content.contents.__unicode__()
que me dará uma única cadeia unicode em vez de uma list