Codificação de caracteres em python para substituir 'u2019' por '
Eu tentei várias maneiras de codificar isso para o resultado final"BACK RUSHIN'"
com o personagem mais importante sendo o apóstrofo certo'
.
Eu gostaria de uma maneira de chegar a esse resultado final usando algumas das funções internas que o Python possui, onde não há discriminação entre uma string normal e uma string unicode.
Este era o código que eu estava usando para recuperar a string:str(unicode(etree.tostring(root.xpath('path')[0],method='text', encoding='utf-8'),errors='ignore')).strip()
Com o resultado sendo:'BACK RUSHIN'
a coisa sendo o apóstrofo'
está desaparecido.
Outra maneira foi:root.xpath('path/text()')
E esse resultado foi:u'BACK RUSHIN\u2019'
em python.
Por fim, se eu tentar:u'BACK RUSHIN\u2019'.encode('ascii', 'replace')
O resultado é:'BACK RUSHIN?'
Por favor, não substitua funções, eu gostaria de fazer uso de bibliotecas de codecs pythons. Também não é possível imprimir a sequência porque ela está sendo mantida em uma variável.
obrigado