Регулярное выражение Python для Beautiful Soup
Я использую Beautiful Soup для извлечения определенных тегов div, и кажется, что могуне использовать простое сопоставление строк.
На странице есть несколько тегов в виде
который я хочу игнорировать, а также некоторые теги в виде
где х 's представляет целое число произвольной длины, а эллипсы представляют произвольное число других значений, разделенных пробелами (то есть I 'меня это не касается). Я могу'не могу понять правильное выражение регулярного выражения, тем более что ямы никогда не использовали Python 'с ре классом.
С помощью
soup.find_all(class_="comment")
находит все теги, начинающиеся со слова комментария. Я пытался использовать
soup.find_all(class_=re.compile(r'(comment)( )(comment)'))
soup.find_all(class_=re.compile(r'comment comment.*'))
и много других вариантов, но я думаю, чтоЯ упускаю что-то очевидное здесь о том, как работают выражения regex или match (). Может кто-нибудь мне помочь?