Manipulando Caracteres e Símbolos do Inglês Americano não Padrão em um CSV, usando Python
Eu tenho uma lista de nomes de lojas, com alguns milhares de nomes, alguns dos quais têm caracteres de inglês americano fora do padrão que estão colocando um problema.
Por exemplo, meu arquivo de entrada se parece com isto:
store_name
yéché
Ázak
ótndle
Eu quero que o arquivo de saída seja realmente assim (acho que o Googledocs fez isso acontecer, btw):
store_name new_store_name
yéché yéché
Ázak Ãzak
ótndle ótndle
Existem apenas cerca de 10 dessas regras que convertem o caractere de inglês americano fora do padrão neste formato, então eu passei e controlei f no excel para torná-las. Mas eu gostaria de poder no futuro fazer coisas assim computacionalmente, e estava apenas imaginando se há uma maneira rápida de fazer isso usando Python. Para ser claro, o que eu quero fazer é fazer:
é become é
Á become Ãi