2009-05-30 11 views
3

Я прочитал где-нибудь, что есть символы другие, чем A-Z, имеющие нижний регистр, в Юникоде. Что это может быть и почему любому другому персонажу нужен верхний и нижний регистр?Юникод строчные буквы?

+11

А если головой подумать? – alamar

+6

Какой наивный вопрос. Разве вы не считаете, что существуют другие языки, кроме английского, с другими алфавитами, чем латинские? – Gumbo

+2

alamar: вы должны были сделать этот комментарий в ответ :) –

ответ

9

Английский язык, и даже этот странный вариант, американский английский :-), не является единственным языком на планете. Есть очень странно выглядящих (по крайней мере, тех, кто знаком с латинскими персонажами), но даже на латинских языках есть небольшие вариации.

Два из которых я знаком с более чем случайной основе являются греческий и немецкий:

Αα Ββ Γγ Δδ Εε Ζζ Ηη Θθ Ιι Κκ Λλ Μμ 
Νν Ξξ Οο Ππ Ρρ Σσς Ττ Υυ Φφ Χχ Ψψ Ωω 

Aa Ää Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn 
Oo Öö Pp Qq Rr Ss ß Tt Uu Üü Vv Ww Xx Yy Zz 

Вот почему мы не разрешается использовать биты кода, как:

char lower = upper - 'A' + 'a'; 

больше. Сделать что-то подобное в компании, которая серьезно относится к i18n, - это почти основания для увольнения. Использование функций Unicode toLower()/toUpper() - это лучший способ пойти.

+5

На немецком языке это еще сложнее: В то время как в верхнем регистре ß недавно появился кодовый номер юникода, на самом деле нет символа ß в верхнем регистре. Единственным правильным отображением верхнего регистра ß является SS. Если вы конвертируете из верхнего регистра в нижний регистр, у вас проблемы, потому что вы не знаете, что SS было в нижнем регистре: ss или ß. (Да, есть шрифты с верхним регистром ß, но это не значит, что это действительный символ в немецком алфавите. Я никогда не видел, чтобы он использовался за пределами демонов для упомянутых шрифтов) –

+1

Является ли ß фактически лигатурой? Это старомодный «long s», соединенный с терминалом s. Вы увидите что-то подобное на английском языке в старой печати Декларации независимости («стремление к счастью», похожее на «пурпурное счастье»). До компьютеризированной верстки лигатуры fl, fi и ffl были распространены в книгах, напечатанных на английском языке. Они не считались одиночными. –

+0

Это лигатура, да, имя «eszett» - это мертвая распродажа («sz»). – paxdiablo

2

Любая буква с акцентом может иметь разную кодовую точку или быть комбинацией более чем одной кодовой точки. Например, ÂËÕÝ - это символы верхнего регистра с эквивалентами в нижнем регистре.

Ключом является правильное внедрение стандартов в отношении настроек локали вашего пользователя или получение такого же эффекта с использованием системных библиотек, которые правильно обрабатывают общий случай toupper()/tolower().

3

Существует много алфавитов, отличных от обычного латинского западноевропейского алфавита, большинство из нас привыкли видеть здесь. Для начала вам понадобятся прописные и строчные буквы букв и лигатур в верхнем и нижнем регистре, например, Аа, IJij и т. Д. Существуют также полные версии латинских символов, используемые при настройке документов на азиатских языках (которые я слишком ленив, чтобы искать). Кроме того, в настоящее время используются другие алфавиты, такие как кириллические (Бб) и греческие (Δδ) алфавиты.

Существует также Турция, которая составляет just kind of difficult в соответствии с Jeff Atwood. Использование функций верхнего и нижнего регистров, предоставляемых вашей средой, - это (как правило) способ использования пользовательских данных.

3

Прописная буква ß не требуется на немецком языке, потому что буква никогда не используется в качестве первой буквы имени или слова. В остальном, на некоторых языках (французский?) Символы с верхним регистром не используются, а не без акцента.

1

на некоторых языках (французский?) Прописные акцентировано символы не используются (...)
[Райнер Бейклс - 10 дек '12 в 19:34]

Ну , да ... но нет!

В хорошем состоянии ручной шрифт, который был правдой. Поскольку подчеркнутая прописная буква (например, «É») поднялась бы слишком высоко на линии, обычная практика заключалась в том, чтобы игнорировать ее просто «E». Затем «des études» обычно появляется как «DES ETUDES» (без акцента).

Но это больше не рекомендуется.Всякий раз, когда вы можете редактировать/печатать/публиковать заостренные заглавные буквы, нам предлагается сделать это. Сама официальная Квебекская «Office de la langue française» на самом деле продвигает это с более чем двух десятилетий!

Это становится особенно важным в нашу эпоху компьютеров и Интернета, где тексты все более обрабатываются (см. &) на машинах. Опущение акцентов может полностью изменить смысл. tache (stain) -vs- tâche (задача), du (of) -vs-dû (что-то, что вы должны заплатить) и много еще много слов. Продолжая пропускать акценты в верхнем регистре, окончательно не очень хорошая идея (хотя старое наследие века). Использование их везде, где это возможно, является гораздо лучшей практикой.

 Смежные вопросы

  • Нет связанных вопросов^_^