Преобразование Little Endian в UTF-8 UCS-2 оставляет файл со многими нежелательными символами
У меня есть скрипт, который я собрал после того, как перебрал много разных способов, которыми я мог бы выполнить преобразование кодировки, используя ADODB в VBScript.
Option Explicit
Sub UTFConvert()
Dim objFSO, objStream, file
file = "FileToConvert.csv"
Set objStream = CreateObject( "ADODB.Stream" )
objStream.Open
objStream.Type = 2
objStream.Position = 0
objStream.Charset = "utf-8"
objStream.LoadFromFile file
objStream.SaveToFile file, 2
objStream.Close
Set objStream = Nothing
End Sub
UTFConvert
Предполагается, что файл будет преобразован из UCS-2 Little Endian или любого читаемого формата (в пределах ограничений) в UTF-8. Проблема, однако, заключается в том, что после того, как этот файл завершил преобразование в UTF-8, существует многоNUL
символы во всем файле до и после каждой буквы, иxFF
xFE
(UCS-2 LE BOM) в начале файла. Они видны без необходимости использования каких-либо переключателей визуализации символов. Любая помощь будет оценена в понимании, где я могу быть ограничен этим преобразованием. Или любой альтернативный подход, который я могу использовать.