Suchergebnisse für Anfrage "python-unicode"

6 die antwort

UnicodeDecodeError: Codec 'utf8' kann Byte 0x80 an Position 3131 nicht decodieren: ungültiges Startbyte

Ich versuche, Twitter-Daten mit Python 2.7.12 aus einer JSON-Datei zu lesen. Code, den ich verwendet habe, ist wie folgt: import json import sys reload(sys) sys.setdefaultencoding('utf-8') def get_tweets_from_file(file_name): tweets = [] with ...

6 die antwort

Lesen russischer Sprachdaten von csv

Ich habe einige Daten in der CSV-Datei, die auf Russisch sind: 2-комнатная квартира РДТ', мкр Тастак-3, Аносова — Толе би;Алматы 2-комнатная квартира БГР', мкр Таугуль, Дулати (Навои) — Токтабаева;Алматы 2-комнатная квартира ЦФМ', мкр Тастак-2, ...

12 die antwort

UnicodeDecodeError: ('utf-8' Codec) beim Lesen einer CSV-Datei [duplizieren]

Diese Frage hat hier bereits eine Antwort: UnicodeDecodeError beim Lesen einer CSV-Datei in Pandas mit Python [/questions/18171739/unicodedecodeerror-when-reading-csv-file-in-pandas-with-python] 9 answerswas ich versuche, liest ein csv, um ein ...

TOP-Veröffentlichungen

4 die antwort

Pytesseract: UnicodeDecodeError: 'charmap' Codec kann Byte nicht entschlüsseln

Ich verwende eine große Anzahl von OCRs für Screenshots mit Pytesseract. Dies funktioniert in den meisten Fällen gut, aber eine kleine Zahl verursacht diesen Fehler: pytesseract.image_to_string(image,None, False, "-psm 6") ...

2 die antwort

Python-String-Argument ohne eine Kodierung

Ich versuche, diesen Code auszuführen, und es wird immer wieder die Fehlermeldung "String argument without a encoding" ausgegeben. ota_packet = ota_packet.encode('utf-8') + bytearray(content[current_pos:(final_pos)]) + ...

2 die antwort

Python gibt eine Länge von 2 für eine einzelne Unicode-Zeichenfolge zurück.

In Python 2.7: In [2]: utf8_str = '\xf0\x9f\x91\x8d' In [3]: print(utf8_str) In [4]: unicode_str = utf8_str.decode('utf-8') In [5]: print(unicode_str) In [6]: unicode_str Out[6]: u'\U0001f44d' In [7]: len(unicode_str) Out[7]: ...

2 die antwort

Deal mit Unicode-Benutzernamen in Python mkdtemp

Ich wurde von @ gebisshttp: //bugs.python.org/issue168197 [http://bugs.python.org/issue1681974] - von dort zitierend: mkdtemp schlägt unter Windows fehl, wenn der Windows-Benutzername Nicht-ASCII-Zeichen wie ä oder ö enthält. mkdtemp gibt einen ...

1 die antwort

Warum lehnt ElementTree UTF-16-XML-Deklarationen mit "falscher Kodierung" ab?

In Python 2.7, wenn eine Unicode-Zeichenfolge an ElementTree übergeben wirdfromstring() Methode, die hatencoding="UTF-16" In der XML-Deklaration wird ein ParseError angezeigt, der besagt, dass die angegebene Kodierung falsch ist: >>> from ...

2 die antwort

Python-lateinische Zeichen und Unicode

Ich habe eine Baumstruktur, in der Schlüsselwörter einige lateinische Zeichen enthalten können. Ich habe eine Funktion, die alle Blätter des Baumes durchläuft und jedes Schlüsselwort unter bestimmten Bedingungen zu einer Liste hinzufügt. Hier ...

1 die antwort

Python-Druck-Unicode-Liste

Mit folgendem Code lst = [u'\u5de5', u'\u5de5'] msg = repr(lst).decode('unicode-escape') print msg ich habe [u'工', u'工']Wie kann ich die Führung entfernenu damit der inhalt vonmsg ist: ['工', '工']