Преобразование Little Endian в UTF-8 UCS-2 оставляет файл со многими нежелательными символами

Question

Sep 02, 2015, 04:15 AM

Преобразование Little Endian в UTF-8 UCS-2 оставляет файл со многими нежелательными символами

У меня есть скрипт, который я собрал после того, как перебрал много разных способов, которыми я мог бы выполнить преобразование кодировки, используя ADODB в VBScript.

Option Explicit

Sub UTFConvert()
    Dim objFSO, objStream, file

    file = "FileToConvert.csv"

    Set objStream = CreateObject( "ADODB.Stream" )
    objStream.Open
    objStream.Type = 2
    objStream.Position = 0
    objStream.Charset = "utf-8"
    objStream.LoadFromFile file
    objStream.SaveToFile file, 2
    objStream.Close
    Set objStream = Nothing
End Sub

UTFConvert

Предполагается, что файл будет преобразован из UCS-2 Little Endian или любого читаемого формата (в пределах ограничений) в UTF-8. Проблема, однако, заключается в том, что после того, как этот файл завершил преобразование в UTF-8, существует многоNUL символы во всем файле до и после каждой буквы, иxFF xFE (UCS-2 LE BOM) в начале файла. Они видны без необходимости использования каких-либо переключателей визуализации символов. Любая помощь будет оценена в понимании, где я могу быть ограничен этим преобразованием. Или любой альтернативный подход, который я могу использовать.

Преобразование Little Endian в UTF-8 UCS-2 оставляет файл со многими нежелательными символами

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Преобразование Little Endian в UTF-8 UCS-2 оставляет файл со многими нежелательными символами

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы