2015-12-08 1 views
1

Я извлекаю текст с веб-страницы с кодировкой Windows-1255 с помощью Node.js. Я пытаюсь расшифровать текст, используя следующие Окна-1255 кодер/декодер: https://www.npmjs.com/package/windows-1255Преобразование из Windows-1255 в UTF-8 в узле JS

После его установки с помощью НПМ и требуя его в соответствующем файле, я пытался использовать его как это:

var title = windows1255.decode('#title').text()); 

Это, похоже, не имеет никакого эффекта. Есть идеи о том, почему?

Спасибо!

Maor

ответ

0

не знаю, если вы все еще ждет ответа об этой проблеме, но следующие работал для меня ...

При получении данных (файл), я установил ГЭТ параметры кодирования, чтобы быть двоичным:

var options = { 
     method: 'GET', 
     url: 'myURL', 
     encoding: 'binary' 
    }; 

    request(options, function (error, response, body) { 

     //deal with hebrew encoding 
     csvString = encoding.convert(body, 'UTF8', "CP1255").toString(); 

Тогда для переключения я кодирования от CP1255 (= windows1255) до UTF8.

Надеюсь, что это поможет :)