Suchergebnisse für Anfrage "cjk"
Wie mache ich einen Python split () für Sprachen (wie Chinesisch), die kein Leerzeichen als Worttrennzeichen verwenden?
Ich möchte einen Satz in eine Liste von Wörtern aufteilen. Für Englisch und europäische Sprachen ist dies einfach, benutze einfach split () >>> "This is a sentence.".split() ['This', 'is', 'a', 'sentence.']Aber ich muss mich auch mit Sätzen in ...
Python: Wie kann ich dieses "hybride" split () für mehrsprachige (z. B. chinesische und englische) Zeichenfolgen ausführen?
Ich habe Zeichenfolgen, die mehrsprachig sind und sowohl aus Sprachen bestehen, die Leerzeichen als Worttrennzeichen verwenden (Englisch, Französisch usw.), als auch aus Sprachen, die dies nicht tun (Chinesisch, Japanisch, Koreanisch). Bei einer ...
Validierung der Kana-Eingabe
Ich arbeite an einer Anwendung, mit der Benutzer Zeichen in japanischer Sprache eingeben können. Ich versuche herauszufinden, ob es sich bei der Benutzereingabe um ein japanisches Kana (Hiragana, Katakana oder Kanji) handelt. Es gibt bestimmte ...
Encoding-Fehler in Python mit chinesischen Zeichen
Ich bin ein Anfänger, der Probleme beim Dekodieren mehrerer Dutzend CSV-Dateien mit Zahlen und (vereinfachten) chinesischen Zeichen in UTF-8 in Python 2.7 hat. Ich kenne die Codierung der Eingabedateien nicht und habe alle mir ...