У нас есть набор приложений, которые были разработаны для набора символов ASCII. Теперь мы пытаемся установить его в Исландии и сталкиваемся с проблемами, когда исландские персонажи напортачиваются.Как вы пишете код, безопасный для UTF-8?
Мы работаем над своими проблемами, но мне было интересно: есть ли там хороший «справочник» для написания кода на C++, который предназначен для 8-битных символов и который будет работать правильно, когда данные UTF-8 будут переданы Это?
Я не могу ожидать, что каждый прочитает весь стандарт Юникода, но если есть что-то более доступное для усвоения, я хотел бы поделиться им с командой, чтобы мы снова не сталкивались с этими проблемами.
Повторное создание всех приложений для использования wchar_t или другого строкового представления в настоящее время невозможно. Я также отмечу, что эти приложения обмениваются данными по сетям с серверами и устройствами, использующими 8-битные символы, поэтому, даже если бы мы сделали Unicode внутри, у нас все еще были бы проблемы с переводом на границах. По большей части эти приложения просто передают данные; они не «обрабатывают» текст каким-либо образом, кроме копирования его с места на место.
В качестве операционных систем используются Windows и Linux. Мы используем std :: string и простые старые строки C. (И не спрашивайте меня, чтобы защитить любого из проектных решений, я просто пытаюсь помочь исправить беспорядок..)
Вот список того, что было предложено:
- The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
- UTF-8 and Unicode FAQ for Unix/Linux
- The Unicode HOWTO
Не могли бы вы подтвердить нашу ОС вашего приложения? Вы программируете для Windows? Вы массово используете std :: string или более низкий уровень C header? –
paercebal
2008-09-25 16:54:15
Если вам нравится ответ, пожалуйста, поддержите его - нет причин быть скупой. – 2008-09-25 17:02:48
Только 30 минут, и вы уже требуете повышения репутации? :) – 2008-09-25 17:15:56