2017-02-07 16 views
0

Я разрабатываю простой формат файла, и вместо поддержки только расширенного US ASCII я думал о поддержке UTF8.Может ли линейная подача (шестнадцатеричная 0x0A) быть юридически встроена в UTF8?

Байт строки строки (шестнадцатеричный 0x0A) является одним из разделителей. Возможно ли, чтобы эта последовательность байтов была встроена в многобайтную последовательность UTF8? Например, если один из начальных байтов имеет высокий бит, установленный (указывающий многобайтовый символ), а один из конечных байтов равен 0x0A?

+2

Нет, поскольку все байты в многобайтовых последовательностях в UTF-8 имеют свой бит бит. – yeputons

ответ

4

Пожалуйста, ознакомьтесь с спецификацией UTF-8. Все байты со значением < = 0x7F рассматриваются как этот код; все байты в многобайтовой последовательности имеют набор высоких бит.

 Смежные вопросы

  • Нет связанных вопросов^_^