Por que recebo um erro “Sequência de bytes inválida em UTF-8” ao ler um arquivo de texto?

Question

Jun 16, 2011, 05:51 PM

Por que recebo um erro “Sequência de bytes inválida em UTF-8” ao ler um arquivo de texto?

Estou escrevendo um script Ruby para processar um arquivo de texto grande e continuo recebendo um erro de codificação estranho. Aqui está a situação:

input_data = File.new(in_path, 'r').read
p input_data.encoding.name   #   UTF-8 
break_char = "\r".encode("UTF-8")
p break_char # "\r"
p break_char.encoding.name # "UTF-8" 
input_data.split(",".encode("UTF-8"))
p Encoding.compatible?(input_data, break_char) # # Encoding:UTF-8>

Isso produz o erro:in 'split': invalid byte sequence in UTF-8 (ArgumentError)

Eu lihttp: //blog.grayproductions.net/articles/ruby_19s_strin e olhou para outras soluções para aparentemente o mesmo problema, mas ainda não consigo entender por que isso está acontecendo quando acredito que estou controlando as codificaçõe

Estou no OSX trabalhando com ruby 1.9.2

questionAnswers(5)

Perguntas populares

0 a resposta

Objetivo da opção EF 6.x DbContext Generator ao adicionar um novo item de dados no Visual Studio

0 a resposta

Como exibir o spinner de carregamento em uma caixa de texto ao clicar em um botão?

0 a resposta

NSJSONSerialization resulta em EXC_BAD_ACCESS

0 a resposta

Primavera, trabalhando com anotações @Configuration e @Bean

0 a resposta

Override shouldInterruptJavaScript no QWebPage com PySide

Você é muito ativo! É ótimo!

Por que recebo um erro &#8220;Sequência de bytes inválida em UTF-8&#8221; ao ler um arquivo de texto?

questionAnswers(5)

yourAnswerToTheQuestion

Perguntas populares

Por que recebo um erro “Sequência de bytes inválida em UTF-8” ao ler um arquivo de texto?