BeautifulSoup Grab Видимый текст веб-страницы
В основном, я хочу использовать BeautifulSoup, чтобы захватить строговидимый текст на веб-странице. Например,эта веб-страница мой контрольный пример. И я в основном хочу просто получить основной текст (статью) и, возможно, даже несколько названий вкладок здесь и там. Я попробовал предложение в этомТАК вопрос который возвращает много<script>
теги и комментарии html, которые я не хочу. Я не могу понять, какие аргументы мне нужны для функцииfindAll()
для того, чтобы просто получить видимые тексты на веб-странице.
Итак, как мне найти весь видимый текст, кроме скриптов, комментариев, CSS и т. Д.?