Wygeneruj listę z łańcucha z odpowiednim kodowaniem (UTF-8)
Trudno mi jest próbować wygenerować listę z ciągu znaków, z odpowiednim kodowaniem UTF-8, używam Pythona (uczę się tylko programować, tak goły z moim głupim pytaniem / strasznym kodowaniem).
Plik źródłowy to tweet feed (format JSON), po pomyślnym przeanalizowaniu go i wyodrębnieniu wiadomości tweet z całej reszty udaje mi się uzyskać tekst z odpowiednim kodowaniem dopiero po wydruku (jako łańcuch). Jeśli spróbuję umieścić pakiet w formularzach listowych, wraca do niekodowanegou\000000
Formularz.
Mój kod to:
import json
with open("file_name.txt") as tweets_file:
tweets_list = []
for a in tweets_file:
b = json.loads(a)
tweets_list.append(b)
tweet = []
for i in tweets_list:
key = "text"
if key in i:
t = i["text"]
tweet.append(t)
for k in tweet:
print k.encode("utf-8")
Jako alternatywę próbowałem kodowania na początku (podczas pobierania pliku):
import json
import codecs
tweets_file = codecs.open("file_name.txt", "r", "utf-8")
tweets_list = []
for a in tweets_file:
b = json.loads(a)
tweets_list.append(b)
tweets_file.close()
tweet = []
for i in tweets_list:
key = "text"
if key in i:
t = i["text"]
tweet.append(t)
for k in tweet:
print k
Moje pytanie brzmi: jak mogę umieścić wynikowe ciągi znaków w liście? Z każdym ciągiem k jako elementem?