Obsługa niestandardowych amerykańskich znaków i symboli w CSV przy użyciu Pythona
Mam listę nazw sklepów, z kilkoma tysiącami nazw, z których niektóre mają niestandardowe znaki amerykańsko-angielskie, które stanowią problem.
Na przykład mój plik wejściowy wygląda tak:
store_name
yéché
Ázak
ótndle
Chcę, aby plik wyjściowy rzeczywiście wyglądał tak (myślę, że Googledocs tak się stało, btw):
store_name new_store_name
yéché yéché
Ázak Ãzak
ótndle ótndle
Istnieje tylko około 10 takich reguł, które przekształcają niestandardowy amerykański angielski znak w ten format, więc przeszedłem i sprawdziłem w programie Excel, aby je utworzyć. Ale chciałbym móc w przyszłości robić takie rzeczy obliczeniowo i zastanawiałem się, czy istnieje szybki sposób na wykonanie tego przy użyciu Pythona. Żeby było jasne, chcę zrobić:
é become é
Á become Ãi