TypeError: In re.findall () kann kein Zeichenfolgenmuster für ein byteähnliches Objekt verwendet werden.

Question

Jun 21, 2015, 07:24 AM

TypeError: In re.findall () kann kein Zeichenfolgenmuster für ein byteähnliches Objekt verwendet werden.

Ich versuche zu lernen, wie man automatisch URLs von einer Seite abruft. Im folgenden Code versuche ich, den Titel der Webseite zu erhalten:

import urllib.request
import re

url = "http://www.google.com"
regex = '<title>(,+?)</title>'
pattern  = re.compile(regex)

with urllib.request.urlopen(url) as response:
   html = response.read()

title = re.findall(pattern, html)
print(title)

Und ich erhalte diesen unerwarteten Fehler:

Traceback (most recent call last):
  File "path\to\file\Crawler.py", line 11, in <module>
    title = re.findall(pattern, html)
  File "C:\Python33\lib\re.py", line 201, in findall
    return _compile(pattern, flags).findall(string)
TypeError: can't use a string pattern on a bytes-like object

Was mache ich falsch