urllib2, открывающий неправильную кодировку
Когда я открываю URL и читаю его, я не могу его распознать. Но когда я проверяю заголовок контента, он говорит, что он закодирован как utf-8. Поэтому я попытался преобразовать его в Unicode, и он пожаловался на UnicodeDecodeError: кодек «ascii» не может декодировать байт 0x8b в позиции 1: порядковый номер не в диапазоне (128) с использованием unicode ().
.encode ("utf-8") создает UnicodeDecodeError: кодек 'ascii' не может декодировать байт 0x8b в позиции 1: порядковый номер не в диапазоне (128)
.decode ("utf-8") сгенерировал UnicodeDecodeError: кодек utf8 не может декодировать байт 0x8b в позиции 1: недопустимый начальный байт.
Я перепробовал все, что мог придумать (я не очень хорош в кодировках)
Я был бы счастлив, если бы я мог заставить это работать. Благодарю.