[C++] The C++ Programming Language: 6. Types and Declarations (2) - Character Types
6.2.3 Character Types 세상에는 다양한 문자들과, 다양한 인코딩 방식이 있습니다. C++는 이를 위해 다양한 문자 자료형을 지원하죠: char: 프로그램 텍스트를 위한 기본 문자 자료형입니다. A char is used for the implementation's character set. 보통 8비트입니다. signed char: char와 비슷하지만 부호를 붙일 수 있습니다. 양수와 음수 값을 가질 수 있습니다. unsigned char: char와 비슷하지만 양수임이 보증됩니다. wchar_t: 유니코드와 같이 큰 문자 집합을 표현할 수 있습니다. wchar_t의 크기는 implementation-defined이며, 아무리 큰 문자 집합이여도 충분할 정도로 큰 크기를 지니고 있습니다. char16_t: UTF-16과 같은 16-비트 문자 집합을 표현합니다. char32_t: UTF-32와 같은 32-비트 문자 집합을 표현합니다. 이러한 6개의 자료형이 존재합니다. 구현상 char형은 signed char, unsigned char와 동일하지만 여전히 그들은 분리된 자료형임에 유의하세요. (생략) 십진수와 26개의 알파벳 문자, 몇몇 구두점 문자들을 포함한 문자 집합을 구현한다는 것은 확실합니다. 하지만 다음을 보장한다고 생각하지는 마세요: 8-비트 문자 집합에는 127개 이하의 문자만 있습니다. (어떤 집합은 때로 255개의 문자를 지원하기도 합니다) 영어에서 쓰이는 알파벳 문자 말고는 존재하지 않습니다. (대부분의 유럽 언어에서는 다른 문자들도 지원하는 경우가 있습니다) 알파벳 문자들의 값은 연속으로 26개에 대응합니다. (EBCDIC는 i와 j 사이에 값의 간격이 있습니다) C++에서 쓰이는 문자는 전부 사용 가능합니다. (어떤 국제 문자 집합에서는 {, }, [, ], |, \를 지원하지 않습니다) char는 1 byte입니다. (char를 4 byte로 처리하는 프로세서들도 존재합니다....