Como remover espaços em branco no BeautifulSoup
Eu tenho um monte de HTML que estou analisando com BeautifulSoup e está indo muito bem, exceto por um pequeno problema. Quero salvar a saída em uma sequência de linhas únicas, com o seguinte como minha saída atual:
<li><span class="plaincharacterwrap break">
Zazzafooky but one two three!
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky2
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky3
</span></li>
Idealmente, eu gostaria
<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li>
Há muitos espaços em branco redundantes dos quais gostaria de me livrar, mas não é necessariamente removível usandostrip()
, nem posso remover descaradamente todos os espaços porque preciso reter o texto. Como eu posso fazer isso? Parece um problema bastante comum que o regex seria um exagero, mas é esse o único caminho?
Eu não tenho nenhum<pre>
tags para que eu possa ser um pouco mais forte lá.
Obrigado mais uma vez!