2013-12-07 1 views
3

Я написал HTML-страницу, которая отображает смешанный иврит/английский content.It отлично работает с Charset «окном - 1255»HTML - кодировка окно 1255 работает, но UTF-8

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd"> 
<html dir="rtl" lang="he"> 
<head> 
<meta http-equiv="Content-Type" content="text/html; charset=windows-1255"> 

, но я полагал, что люди будут иметь если их машины не поддерживают иврит. Я изменил кодировку на UTF-8 и получил

HTML:

meta http-equiv="Content-Type" content="text/html; charset=utf-8" 

Вид:

"��� ��� ������, ��� ����� �����, �� ������ ���� ��� ���� �� ������" 
Read zohar ��� ���� 
.... 

Не UTF-8, предполагают, чтобы поддерживать большее количество символов, то окна 1255?

ответ

6

Я думаю, что когда вы изменили тег, вы не сказали своему редактору преобразовать файл в UTF-8. Таким образом, файл все еще находится в формате Windows-1255, но браузер пытается его прочитать, как если бы он был UTF-8, поэтому вы получаете плохие/нечитаемые символы.

Я не знаю, какой редактор вы используете, поэтому я не могу сказать вам, как поместить его в режим UTF-8. Попытайтесь найти параметр в своих настройках относительно набора символов, который будет использоваться. Или откройте файл в блокноте Windows, и при его сохранении убедитесь, что вы выбрали «Codepage: UTF-8» в раскрывающемся списке рядом с кнопкой сохранения.

+0

На самом деле, я использовал блокнот в качестве редактора ... так как HTML не является моим основным полем в knowladge. Я не знал о таких деталях. Спасибо. – Alaychem

-2

Отношение к Unicode

Блок Юникода иврит (U + 0590-U + 05FF) следующим образом Windows-1255 путем кодирования как буквы, так и гласных точек в одних и тех же относительных положениях, как Windows-1255. Unicode идет дальше в кодировании кантиляционных меток в нижних положениях. Юникод Иврит всегда в логическом порядке.

Для современных приложений UTF-8 или UTF-16 является предпочтительным кодированием.

Источник: http://en.wikipedia.org/wiki/Windows_1255

Мне кажется, что ваше кодирование должно работать, если ваши персонажи находятся в пределах блока Unicode иврит.

+0

хорошо, символы находятся в пределах диапазона. Все еще не работает – Alaychem

+1

Когда вы используете метатег для установки кодировки в Юникод, вы обещаете браузеру, что страница находится в Юникоде. Если ваш html-файл на сервере все еще закодирован в Windows-1255, он будет отображаться неправильно. –