Obsługa niestandardowych amerykańskich znaków i symboli w CSV przy użyciu Pythona

Question

Sep 10, 2012, 08:15 PM

Obsługa niestandardowych amerykańskich znaków i symboli w CSV przy użyciu Pythona

Mam listę nazw sklepów, z kilkoma tysiącami nazw, z których niektóre mają niestandardowe znaki amerykańsko-angielskie, które stanowią problem.

Na przykład mój plik wejściowy wygląda tak:

store_name
yéché
Ázak
ótndle

Chcę, aby plik wyjściowy rzeczywiście wyglądał tak (myślę, że Googledocs tak się stało, btw):

store_name  new_store_name 
yéché       yÃ©chÃ©
Ázak        Ãzak
ótndle      Ã³tndle

Istnieje tylko około 10 takich reguł, które przekształcają niestandardowy amerykański angielski znak w ten format, więc przeszedłem i sprawdziłem w programie Excel, aby je utworzyć. Ale chciałbym móc w przyszłości robić takie rzeczy obliczeniowo i zastanawiałem się, czy istnieje szybki sposób na wykonanie tego przy użyciu Pythona. Żeby było jasne, chcę zrobić: