Python nltk.sent_tokenize error códec ASCII no puede decodificar

Pude leer con éxito el texto en una variable, pero al intentar simular los textos obtengo este extraño error:

sentences=nltk.sent_tokenize(sample)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 11: ordinal not in range(128)

Sé que la causa del error es alguna cadena / char especial que el tokenizador no puede leer / decodificar, pero ¿cómo evitar esto? Gracias

Respuestas a la pregunta(2)

Su respuesta a la pregunta