Next: Chars and Bytes, Previous: Character Codes, Up: Non-ASCII Characters
Emacsは文字をさまざまな文字集合(character set)に分類します。 文字集合にはシンボルである名前があります。 各文字はたった1つの文字集合に属します。
一般に、異なる文字体系ごとに1つの文字集合があります。
たとえば、latin-iso8859-1
は1つの文字集合であり、
greek-iso8859-7
は別の文字集合であり、
ascii
も別の文字集合です。
Emacsの1つの文字集合には最大9025個の文字を保持できます。
したがって、論理的には1つの文字集合にまとめられる文字群を、
複数の文字集合に分割する場合もあります。
たとえば、Big 5として一般には知られている中国文字の1つの集合は、
Emacsの2つの文字集合、chinese-big5-1
とchinese-big5-2
に
分割されます。