Кодировка Big5 to utf-8 при просмотре веб-сайта с Node-запросом
Я новичок в Node.js и пытаюсь использовать модель запроса для удаления веб-сайта. У меня возникли проблемы с кодировкой: целевой веб-сайт использует big5 в качестве кодировки, и я хотел бы переключить его на utf-8 с следующий код:
var Iconv = require('iconv').Iconv;
var fs = require('fs');
var big5_to_utf8 = new Iconv('big5', 'utf-8');
var buffer = big5_to_utf8.convert(fs.readFileSync('./test'));
console.log(buffer.toString());
Я сомневаюсь, что проблема может быть вызвана из-за некоторых ошибок в процессе утилизации, поэтому для справки мой код для утилизации:
var fs = require('fs');
var request = require('request');
var j = request.jar()
var cookie = request.cookie('ASPSESSIONIDCSDCTTSR=KDMMMIMDCCIHJIJFDKGEDFOH')
j.add(cookie)
request({
url: 'http://amis.afa.gov.tw/v-asp/v101r.asp',
method: "POST",
"Content-type": "application/x-www-form-urlencoded;",
jar:true,
encoding: 'utf-8',
form: {
mhidden1:false,
myy:101,
mmm:9,
mdd:25,
mpno:"FC",
mpnoname:"%ADJ%A5%CA++++",
B1:"%B6%7D%A9l%ACd%B8%DF",
}
}, function (error, response, body) {
console.log(body);
fs.writeFile("test", body);
});
Очень ценю вашу помощь.
РЕДАКТИРОВАТЬ:
Чтобы быть более точным в ошибке, вот что возвращает код:
<p align="center"><font color="#800080">�Шϥ��s�����u���C��</font><em><font
size="4" color="#000080">[�W�@��]</font></em><font color="#800080">�^���e�@���J�����e���~���d��</font></p>
Вот что он должен вернуть:
<p align="center"><font color="#800080">請使用瀏覽器工具列中</font><em><font size="4" color="#000080">[上一頁]</font></em><font color="#800080">回到前一輸入條件畫面繼續查詢</font></p>
Я также попытался использовать iconv-lite вместо iconv, заменив вызов функции следующим:
function (error, response, body) {
var bufferhelper = new BufferHelper();
bufferhelper.concat(body);
console.log(iconv.decode(bufferhelper.toBuffer(), 'Big5'));
});
Только чтобы получить:
<p align="center"><font color="#800080">�濆詉胬胬譃胬舚胬</font><em><font
size="4" color="#000080">[抝胬]</font></em><font color="#800080">䒷胬蓚胬鸜胬胬蓚胬趦胬胬</font</p>