В спецификации JVM, в the description of the modified UTF-8, он утверждает формат v
для «формата два раза-три байт»:Формата V в JVM модифицированного UTF-8
Это означает, что дополнительные символы представлены шестью байтами, u, v, w, x, y и z
Таблица 4.14. v: 1010 (биты 20-16) -1
С v
8 бит, это означает, что (bits 20-16)-1
должен быть 4 бита. Как может -1
сжать bits 20-26
от 5 до 4 бит?
(Дополнительный вопрос: есть ли основания говорить о «двух раз-три байта», а не «шесть байт»?)