Citações no arquivo delimitado por tabulações
Eu tenho um aplicativo simples que abre um arquivo de texto delimitado por tabulação e insere esses dados em um banco de dados.
Estou usando este leitor de CSV para ler os dados:http://www.codeproject.com/KB/database/CsvReader.aspx
E está tudo funcionando muito bem!
Agora, meu cliente adicionou um novo campo ao final do arquivo, que é "ClaimDescription", e em algumas dessas descrições de declaração, os dados têm aspas, por exemplo:
"SUMISEI MARU NO 2" - mar do Japão
Isso parece estar causando uma grande dor de cabeça no meu aplicativo. Eu recebo uma exceção que se parece com isso:
O CSV parece estar corrompido perto do registro '1470' campo '26 na posição '181'. Dados brutos atuais: ...
E nesses "dados brutos", com certeza o campo de descrição da reivindicação mostra dados com aspas.
Quero saber se alguém já teve esse problema antes e contornou-o? Obviamente, posso pedir ao cliente que altere os dados que originalmente enviaram para mim, mas esse é um processo automatizado que eles usam para gerar o arquivo delimitado por tabulação; e prefiro usar isso como último recurso.
Eu estava pensando que talvez pudesse abrir o arquivo usando um TextReader padrão antes, escapar de aspas, gravar o conteúdo novamente em um novo arquivo e depois alimentá-lo no CSV Reader. Provavelmente vale a pena mencionar que o tamanho médio desses arquivos delimitados por tabulação é de cerca de 40 MB.
Qualquer ajuda é muito apreciada!
Cheers, Sean