次: , 前: Character Codes, 上: Non-ASCII Characters


32.5 文字集合

Emacsは文字をさまざまな文字集合(character set)に分類します。 文字集合にはシンボルである名前があります。 各文字はたった1つの文字集合に属します。

一般に、異なる文字体系ごとに1つの文字集合があります。 たとえば、latin-iso8859-1は1つの文字集合であり、 greek-iso8859-7は別の文字集合であり、 asciiも別の文字集合です。 Emacsの1つの文字集合には最大9025個の文字を保持できます。 したがって、論理的には1つの文字集合にまとめられる文字群を、 複数の文字集合に分割する場合もあります。 たとえば、Big 5として一般には知られている中国文字の1つの集合は、 Emacsの2つの文字集合、chinese-big5-1chinese-big5-2に 分割されます。

— 機能: charsetp object

objectが文字集合の名前のシンボルであればtを返す。 さもなければnilを返す。

— 機能: charset-list

この関数は、定義されているすべての文字集合の名前のリストを返す。

— 機能: char-charset character

この関数は文字characterが属する文字集合の名前を返す。