私の講義を受ける上で注意してほしいこと

漢字まで込めて, 日本語がコンピュータでそこそこ使えるようになったのは, 1978年に制定された, JIS X 0208 と呼ばれる文字コードです (JIS = Japan Industrial Standard: 日本工業規格). これは 7bit $\times$ 2 バイト(もしくは 8bit $\times$ 2)の文字コードでした. 問題になるのは, この文字コードに数字やアルファベットが定義されていたことです. つまり, ASCII コードと同じ文字が異なる数に対応するように JIS でも定義されました. コンピュータ自体, あるいはそれを動かす基本ソフトは, ほとんどの場合アメリカで開発されましたから, 当然, ASCII コードを基本とする処理系が作られます. 日本では, それに上の JIS X 0208を加えて動かすというシステムになりました. そのための工夫が, MS-KANJIだったり, EUCだったわけです.

その世界では, アルファベットの Aに対応する数が 2 種類あることになります. そこで, ASCII の文字幅を JIS X 0208の文字幅の半分で表示するフォント (Font, 文字の形を表示するためのデータ)が作られました. これが, 全角/半角という言葉の起源です.

しかし, プログラムなどを作る側から考えると, そのようなシステムは不便です. 「1」という文字を探すのにも, ASCII と JIS X 0208の両方を探さなければいけないからです. また, プログラミングなどでは, プログラムで意味を持つ単語は, ASCII 文字を使うのが通常で, JIS X 0208 のような文字は, 文字列定数としてしか使わないのが基本です.

現在, 上のような「ASCII + 現地語」のようなシステムは, ほぼ無くなっていると思います. しかし, 残念ながら, Unicode を策定するときにも, 「複数の数が同じ文字に対応する」という愚行が継承されました. この授業では, HTML を講義する予定ですが, それ以外の場面でも私の授業では,

ASCII で定義されている文字は, 半角を利用する.

を守ってください. 前回の資料でも述べましたが, 特に邪悪なのが「全角の空白」です. これが原因でうまいかないことが往々にしてあり, 見えないので, 原因究明に時間がかかるのです. 他にも, 括弧などの記号とかにも注意してください.

前回の資料で,「全角の空白で位置揃えをするな」と書きました. ほとんどの場合, 位置揃えには全角空白以外の方法が用意されており, 位置揃えをすることを意識的に行えるようになっています. つまり,「全角の空白」というのは, 全く存在価値のない文字なのです.

次の問は, 高校の数学 Aの復習です. レポート問題ではありませんが, 数理の学生としては, このくらいはできるようになっておいてください.

問 10 進法で 0.1 と表記される数を 2 進法で表すとどうなるか.

2024-04-26