Как заставить BeautifulSoup 4 уважать самозакрывающийся тег?
Этот вопрос относится кBeautifulSoup4, что отличает его от предыдущих вопросов:
Почему BeautifulSoup модифицирует мои самозакрывающиеся элементы?
selfClosingTags в BeautifulSoup
посколькуBeautifulStoneSoup
ушел (предыдущий парсер XML), как я могу получитьbs4
уважать новый самозакрывающийся тег? Например:
import bs4
S = ''' '''
soup = bs4.BeautifulSoup(S, selfClosingTags=['bar'])
print soup.prettify()
Не закрываетbar
тег, но дает подсказку. Что это за конструктор деревьев, на который ссылается bs4, и как мне самому закрыть тег?
/usr/local/lib/python2.7/dist-packages/bs4/__init__.py:112: UserWarning: BS4 does not respect the selfClosingTags argument to the BeautifulSoup constructor. The tree builder is responsible for understanding self-closing tags.
"BS4 does not respect the selfClosingTags argument to the "