TypeError: In re.findall () kann kein Zeichenfolgenmuster für ein byteähnliches Objekt verwendet werden.
Ich versuche zu lernen, wie man automatisch URLs von einer Seite abruft. Im folgenden Code versuche ich, den Titel der Webseite zu erhalten:
import urllib.request
import re
url = "http://www.google.com"
regex = '<title>(,+?)</title>'
pattern = re.compile(regex)
with urllib.request.urlopen(url) as response:
html = response.read()
title = re.findall(pattern, html)
print(title)
Und ich erhalte diesen unerwarteten Fehler:
Traceback (most recent call last):
File "path\to\file\Crawler.py", line 11, in <module>
title = re.findall(pattern, html)
File "C:\Python33\lib\re.py", line 201, in findall
return _compile(pattern, flags).findall(string)
TypeError: can't use a string pattern on a bytes-like object
Was mache ich falsch