Maneira confiável de obter apenas o texto do email, excluindo os emails anteriores
Estou criando um sistema básico que permite aos usuários responder a um tópico no site por e-mail. No entanto, a maioria dos clientes de email inclui o texto dos emails anteriores nos emails de resposta. Este texto não é desejado no site.
Existe uma maneira confiável de extrair apenas a nova mensagem, sem o conhecimento prévio dos emails anteriores? Estou usando oemail
classe de Python.
Content-Type: text/plain; charset=ISO-8859-1
test message! This is the part I want.
On Thu, Mar 24, 2011 at 3:51 PM, <[email protected]> wrote:
> Hi!
>
> Herman just posted a comment on the website:
>
>
> From: Herman
> "Hi there! I might be interested"
>
>
> Regards,
> The Website Team
> http://www.test.com
>
Esta é uma mensagem de resposta do Gmail. Tenho certeza de que outros clientes podem fazê-lo de maneira diferente. Um bom começo provavelmente seria ignorar as linhas que começam com>
, mas também pode haver linhas assim entre a nova mensagem e, provavelmente, elas devem ser mantidas. Também terei a linha do tipo de conteúdo e a linha da data.