[ruby] [кодировка] [utf8] [кодировка файла] [кодировка символов]
у сценарий Ruby для обработки большого текстового файла и получаю странную ошибку кодирования. Вот ситуация:
input_data = File.new(in_path, 'r').read
p input_data.encoding.name # UTF-8
break_char = "\r".encode("UTF-8")
p break_char # "\r"
p break_char.encoding.name # "UTF-8"
input_data.split(",".encode("UTF-8"))
p Encoding.compatible?(input_data, break_char) # # Encoding:UTF-8>
Это приводит к ошибке:in 'split': invalid byte sequence in UTF-8 (ArgumentError)
Я читаюhttp://blog.grayproductions.net/articles/ruby_19s_string и посмотрел на другие решения, по-видимому, той же проблемы, но все еще не могу понять, почему это происходит, когда я считаю, что я контролирую кодировки.
Я на OSX работаю с ruby 1.9.2