Регулярное выражение Python для Beautiful Soup

Question

Dec 10, 2012, 03:18 AM

Регулярное выражение Python для Beautiful Soup

Я использую Beautiful Soup для извлечения определенных тегов div, и кажется, что могуне использовать простое сопоставление строк.

На странице есть несколько тегов в виде

который я хочу игнорировать, а также некоторые теги в виде

где х 's представляет целое число произвольной длины, а эллипсы представляют произвольное число других значений, разделенных пробелами (то есть I 'меня это не касается). Я могу'не могу понять правильное выражение регулярного выражения, тем более что ямы никогда не использовали Python 'с ре классом.

С помощью

soup.find_all(class_="comment")

находит все теги, начинающиеся со слова комментария. Я пытался использовать

soup.find_all(class_=re.compile(r'(comment)( )(comment)'))
soup.find_all(class_=re.compile(r'comment comment.*'))

и много других вариантов, но я думаю, чтоЯ упускаю что-то очевидное здесь о том, как работают выражения regex или match (). Может кто-нибудь мне помочь?

Регулярное выражение Python для Beautiful Soup

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Регулярное выражение Python для Beautiful Soup

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы