Suchergebnisse für Anfrage "unicode"

6 die antwort

Encodierungsproblem beim Herunterladen von HTML mit mechanize und Python 2.6

browser = mechanize.Browser() page = browser.open(url) html = page.get_data() print htmlEs zeigt einige seltsame Zeichen. Ich nehme an, dass es sich um eine UTF-8-Zeichenfolge handelt, aber Python weiß das nicht und kann sie nicht richtig ...

2 die antwort

Kann ein kombinierendes Zeichen in Unicode alleine verwendet werden?

Lass uns nehmenCOMBINING ACUTE ACCENT [http://www.fileformat.info/info/unicode/char/0301/index.htm], zum Beispiel. Es istbrowser test page [http://www.fileformat.info/info/unicode/char/0301/browsertest.htm] fügt es zwar alleine in die Seite ein, ...

4 die antwort

Wie arbeite ich mit Ersatzpaaren in Python?

Dies ist ein Follow-up zuConverting to Emoji [https://stackoverflow.com/questions/38106422/converting-to-emoji]. In dieser Frage hatte das OP einjson.dumps() -codierte Datei mit einem Emoji als Ersatzpaar -\ud83d\ude4f. Er / sie hatte Probleme ...

TOP-Veröffentlichungen

4 die antwort

Dynamisches Erstellen von NSString mit Unicode-Emoji

Ich habe die Zeichenfolge@"Hi there! \U0001F603", das das Emoji wie @ korrekt anzeiHi there! wenn ich es in ein @ stecUILabel. Aber ich möchte es dynamisch wie @ erstell[NSString stringWithFormat:@"Hi there! \U0001F60%ld", ...

4 die antwort

Ist die Bytereihenfolge von UTF-8 auf Big-Endian-Computern nicht anders als auf Little-Endian-Computern? Warum benötigt UTF-8 dann keine Stückliste?

UTF-8 kann eine Stückliste enthalten. Es macht jedoch keinen Unterschied in Bezug auf die Endianität des Bytestroms. UTF-8 hat immer die gleiche Bytereihenfolge. WennUtf-8 hat alle Codepunkte in einem einzigen Byte gespeichert, dann ist ...

10 die antwort

Behandlung eines Unicode-Strings in Delphi-Versionen <= 2007

Hintergrund Diese Frage bezieht sich auf Delphi-Versionen unter 2009 (dh ohne eingebaute Unicode-Unterstützung). Ich habe eine Spezifikation, nach der ich eine Unicode-codierte Zeichenfolge über eine TCP-Verbindung übertragen muss, aber ich habe ...

4 die antwort

Wie kann ich einen Bereich von Unicode-Zeichen angeben?

Wie gebe ich einen Bereich von Unicode-Zeichen aus @ a' ' (Leerzeichen) bis\u00D7FF? Ich habe einen regulären Ausdruck wier'[\u0020-\u00D7FF]' und es wird nicht kompiliert, dass es ein schlechter Bereich ist. Ich bin neu in ...

6 die antwort

Problem mit UTF-8-Zeichen; Was ich sehe, ist nicht das, was ich gespeichert habe

Ich habe versucht, UTF-8 zu verwenden und bin auf Probleme gestoßen. Ich habe so viele Dinge ausprobiert; Hier sind die Ergebnisse, die ich erhalten habe: ???? anstelle von asiatischen Zeichen. Sogar für europäischen Text habe ...

2 die antwort

Warum codiert JSON UTF-16-Ersatzpaare anstelle von Unicode-Codepunkten direkt?

Um einem Codepunkt zu entgehen, der nicht in der mehrsprachigen Grundebene enthalten ist, wird das Zeichen als zwölfstellige Folge dargestellt, die das UTF-16-Ersatzpaar codiert. So kann beispielsweise eine Zeichenfolge, die nur ...

4 die antwort

Decoding wenn es nicht Unicode ist

Ich möchte, dass meine Funktion ein Argument akzeptiert, das ein Unicode-Objekt oder eine utf-8-codierte Zeichenfolge sein kann. In meiner Funktion möchte ich das Argument in Unicode konvertieren. Ich habe so etwas: def myfunction(text): if not ...