次: , 前: Selecting a Representation, 上: Non-ASCII Characters


32.4 文字コード

ユニバイトとマルチバイトのテキスト表現では、 異なる文字コードを使っています。 ユニバイト表現において正しい文字コードは0から255の範囲であり、 これらの値は1バイトに収まります。 マルチバイト表現において正しい文字コードは0から524287の範囲ですが、 この範囲のすべての値が正しいとは限りません。 特に、値128から255は (『生のバイト』にはありうる。see Explicit Encoding)、 マルチバイトテキストでは正しくありません。 0から127のASCIIコードのみが、どちらの表現でも完全に正しいのです。

— 機能: char-valid-p charcode

この関数は、charcodeが2つのテキスト表現のどちらか一方で 正しければtを返す。

          (char-valid-p 65)
               => t
          (char-valid-p 256)
               => nil
          (char-valid-p 2248)
               => t