2013-04-15 1 views
1

Мое понимание HTML5 является THT, когда один получилHTML5 с кодировкой = UTF-8

<meta http-equiv="content-type" content="text/html;charset=UTF-8" /> 

в заголовке документа только символы, которые должны быть преобразованы в лиц являются > < & ' и ".

  1. Это правильно?
  2. В некоторых базовых тестах в Chrome я обнаружил, что могу придерживаться, например, буквально < и уйти с ним. Это просто плохая практика или есть больше нюансов правила entites?
+0

[Великий эскапизм (или: что вам нужно знать, чтобы работать с текстом внутри текста)] (http://kunststube.net/escapism/) – deceze

+0

Спасибо за это – DroidOS

ответ

2

Шарфы < > & являются специальными. Они должны быть экранированы, поэтому анализатор не смущен, и вы можете их отображать. Это не зависит от кодировки.

Старые кодировки не могут отображать такие вещи, как ä ö ü ß, поэтому вам нужно их избежать. В UTF-8 вам не нужно использовать сущности, потому что кодировка поддерживает их native, и они не смешиваются с синтаксисом XML.

' " также специальные, но только в атрибутах, где вы хотите, чтобы убедиться, что двойная цитата может быть внутри двойных кавычек, записанную признак (как с одной цитатой полукокса внутри атрибута одинарные кавычки).
Это как на других языках, где вы можете обменять на обозначения, например '"' и "'". Теперь, если вы создаете значение из базы данных, вам не нужно менять кавычки, вы можете просто избежать их с помощью сущностей.

+0

Это не совсем ответит на мой вопрос, но Я голосую, потому что это полезно – DroidOS