Я разрабатываю простой формат файла, и вместо поддержки только расширенного US ASCII я думал о поддержке UTF8.Может ли линейная подача (шестнадцатеричная 0x0A) быть юридически встроена в UTF8?
Байт строки строки (шестнадцатеричный 0x0A) является одним из разделителей. Возможно ли, чтобы эта последовательность байтов была встроена в многобайтную последовательность UTF8? Например, если один из начальных байтов имеет высокий бит, установленный (указывающий многобайтовый символ), а один из конечных байтов равен 0x0A?
Нет, поскольку все байты в многобайтовых последовательностях в UTF-8 имеют свой бит бит. – yeputons