[ruby] [кодировка] [utf8] [кодировка файла] [кодировка символов]

у сценарий Ruby для обработки большого текстового файла и получаю странную ошибку кодирования. Вот ситуация:

input_data = File.new(in_path, 'r').read
p input_data.encoding.name   #   UTF-8 
break_char = "\r".encode("UTF-8")
p break_char # "\r"
p break_char.encoding.name # "UTF-8" 
input_data.split(",".encode("UTF-8"))
p Encoding.compatible?(input_data, break_char) # # Encoding:UTF-8>

Это приводит к ошибке:in 'split': invalid byte sequence in UTF-8 (ArgumentError)

Я читаюhttp://blog.grayproductions.net/articles/ruby_19s_string и посмотрел на другие решения, по-видимому, той же проблемы, но все еще не могу понять, почему это происходит, когда я считаю, что я контролирую кодировки.

Я на OSX работаю с ruby ​​1.9.2

Ответы на вопрос(5)

Ваш ответ на вопрос