2015-03-21 3 views
10

Следующий код воспроизводит мою проблему:соиЬ << setw не правильно выравнивать с Aao

#include <iostream> 
#include <iomanip> 
#include <string> 

void p(std::string s, int w) 
{ 
    std::cout << std::left << std::setw(w) << s; 
} 

int main(int argc, char const *argv[]) 
{ 
    p("COL_A", 7); 
    p("COL_B", 7); 
    p("COL_C", 5); 
    std::cout << std::endl; 
    p("ABC", 7); 
    p("ÅÄÖ", 7); 
    p("ABC", 5); 
    std::cout << std::endl; 
    return 0; 
} 

Это производит следующий вывод:

COL_A COL_B COL_C 
ABC ÅÄÖ ABC 

Если я изменить «АОА» в коде например, «ABC», то он работает:

COL_A COL_B COL_C 
ABC ABC ABC 

Почему это происходит?

+2

Попробуйте напечатать длину ваших строк. – Hurkyl

ответ

6

Наряду с imbuing std::cout с правильной локалью вам, вероятно, придется переключиться на широкие строки. Например:

void p(std::wstring s, int w) 
{ 
    std::wcout << std::left << std::setw(w) << s; 
} 

int main(int argc, char const *argv[]) 
{ 
    std::locale loc("en_US.UTF-8"); 
    std::wcout.imbue(loc); 

    p(L"COL_A", 7); 
    p(L"COL_B", 7); 
    p(L"COL_C", 5); 
    std::wcout << std::endl; 
    p(L"ABC", 7); 
    p(L"ÅÄÖ", 7); 
    p(L"ABC", 5); 
    std::wcout << std::endl; 
    return 0; 
} 

Demo

2

Проблема заключается в том, что ваш исходный код, безусловно, хранится в UTF8, что означает 2 байта для каждой буквы ÅÄÖ, и языковой стандарт для cout не установлен соответствующим образом.

Следовательно, ваш cout считает, что он выводит 3x2 = 6 символов и добавляет только одно пространство для достижения ожидаемого 7. Измените язык с помощью функции imbue(), чтобы установить его в UTF8.

5

Это происходит потому, что эти символы (Ä, ..., ...) являются символами Юникода, которые, вероятно, кодируются в UTF-8. Это означает, что каждый символ занимает несколько байтов (два в вашем случае, до четырех в общем случае). setw OTOH не знает о UTF-8 - он просто подсчитывает и, таким образом, выравнивает байты.