Suchergebnisse für Anfrage "unicode"
Encodierungsproblem beim Herunterladen von HTML mit mechanize und Python 2.6
browser = mechanize.Browser() page = browser.open(url) html = page.get_data() print htmlEs zeigt einige seltsame Zeichen. Ich nehme an, dass es sich um eine UTF-8-Zeichenfolge handelt, aber Python weiß das nicht und kann sie nicht richtig ...
Kann ein kombinierendes Zeichen in Unicode alleine verwendet werden?
Lass uns nehmenCOMBINING ACUTE ACCENT [http://www.fileformat.info/info/unicode/char/0301/index.htm], zum Beispiel. Es istbrowser test page [http://www.fileformat.info/info/unicode/char/0301/browsertest.htm] fügt es zwar alleine in die Seite ein, ...
Wie arbeite ich mit Ersatzpaaren in Python?
Dies ist ein Follow-up zuConverting to Emoji [https://stackoverflow.com/questions/38106422/converting-to-emoji]. In dieser Frage hatte das OP einjson.dumps() -codierte Datei mit einem Emoji als Ersatzpaar -\ud83d\ude4f. Er / sie hatte Probleme ...
Dynamisches Erstellen von NSString mit Unicode-Emoji
Ich habe die Zeichenfolge@"Hi there! \U0001F603", das das Emoji wie @ korrekt anzeiHi there! wenn ich es in ein @ stecUILabel. Aber ich möchte es dynamisch wie @ erstell[NSString stringWithFormat:@"Hi there! \U0001F60%ld", ...
Ist die Bytereihenfolge von UTF-8 auf Big-Endian-Computern nicht anders als auf Little-Endian-Computern? Warum benötigt UTF-8 dann keine Stückliste?
UTF-8 kann eine Stückliste enthalten. Es macht jedoch keinen Unterschied in Bezug auf die Endianität des Bytestroms. UTF-8 hat immer die gleiche Bytereihenfolge. WennUtf-8 hat alle Codepunkte in einem einzigen Byte gespeichert, dann ist ...
Behandlung eines Unicode-Strings in Delphi-Versionen <= 2007
Hintergrund Diese Frage bezieht sich auf Delphi-Versionen unter 2009 (dh ohne eingebaute Unicode-Unterstützung). Ich habe eine Spezifikation, nach der ich eine Unicode-codierte Zeichenfolge über eine TCP-Verbindung übertragen muss, aber ich habe ...
Wie kann ich einen Bereich von Unicode-Zeichen angeben?
Wie gebe ich einen Bereich von Unicode-Zeichen aus @ a' ' (Leerzeichen) bis\u00D7FF? Ich habe einen regulären Ausdruck wier'[\u0020-\u00D7FF]' und es wird nicht kompiliert, dass es ein schlechter Bereich ist. Ich bin neu in ...
Problem mit UTF-8-Zeichen; Was ich sehe, ist nicht das, was ich gespeichert habe
Ich habe versucht, UTF-8 zu verwenden und bin auf Probleme gestoßen. Ich habe so viele Dinge ausprobiert; Hier sind die Ergebnisse, die ich erhalten habe: ???? anstelle von asiatischen Zeichen. Sogar für europäischen Text habe ...
Warum codiert JSON UTF-16-Ersatzpaare anstelle von Unicode-Codepunkten direkt?
Um einem Codepunkt zu entgehen, der nicht in der mehrsprachigen Grundebene enthalten ist, wird das Zeichen als zwölfstellige Folge dargestellt, die das UTF-16-Ersatzpaar codiert. So kann beispielsweise eine Zeichenfolge, die nur ...
Decoding wenn es nicht Unicode ist
Ich möchte, dass meine Funktion ein Argument akzeptiert, das ein Unicode-Objekt oder eine utf-8-codierte Zeichenfolge sein kann. In meiner Funktion möchte ich das Argument in Unicode konvertieren. Ich habe so etwas: def myfunction(text): if not ...