Suchergebnisse für Anfrage "cjk"

16 die antwort

Wie mache ich einen Python split () für Sprachen (wie Chinesisch), die kein Leerzeichen als Worttrennzeichen verwenden?

Ich möchte einen Satz in eine Liste von Wörtern aufteilen. Für Englisch und europäische Sprachen ist dies einfach, benutze einfach split () >>> "This is a sentence.".split() ['This', 'is', 'a', 'sentence.']Aber ich muss mich auch mit Sätzen in ...

10 die antwort

Python: Wie kann ich dieses "hybride" split () für mehrsprachige (z. B. chinesische und englische) Zeichenfolgen ausführen?

Ich habe Zeichenfolgen, die mehrsprachig sind und sowohl aus Sprachen bestehen, die Leerzeichen als Worttrennzeichen verwenden (Englisch, Französisch usw.), als auch aus Sprachen, die dies nicht tun (Chinesisch, Japanisch, Koreanisch). Bei einer ...

6 die antwort

Validierung der Kana-Eingabe

Ich arbeite an einer Anwendung, mit der Benutzer Zeichen in japanischer Sprache eingeben können. Ich versuche herauszufinden, ob es sich bei der Benutzereingabe um ein japanisches Kana (Hiragana, Katakana oder Kanji) handelt. Es gibt bestimmte ...

TOP-Veröffentlichungen

6 die antwort

Encoding-Fehler in Python mit chinesischen Zeichen

Ich bin ein Anfänger, der Probleme beim Dekodieren mehrerer Dutzend CSV-Dateien mit Zahlen und (vereinfachten) chinesischen Zeichen in UTF-8 in Python 2.7 hat. Ich kenne die Codierung der Eingabedateien nicht und habe alle mir ...