国際文字名

C99 及び C++では、基本文字集合にない文字を、\uxxxx 又は \Uxxxxxxxxを使って表現できるが、
両者では、若干仕様が異なっている。


簡単なまとめ
識別子として使える文字の違い。

  • C++では、半角カナ、全角英文字が利用可。
  • ハングルの取り扱いが大きく異なる。(C++では、\u1100あたりから始まる字母を使用するのに対し、C99では、\uac00あたりから始まる完成形*1を使用する)
  • その他細かい差異多数。

C++0xで使える文字についてはまだ調べていない。


文字(列)で使える文字の違い

  • C++では、サロゲートペアの指定が可能(C99、C++0xでは不可)。
  • C++0xでは、制御文字(\u0000-\u001f,\u0080-\u009f)の指定が可能(C99、C++では不可)。

参考
C99の新機能
N2170







*1:コード表以外では、使われたことのない文字がいっぱい