私の講義を受ける上で注意してほしいこと

漢字まで込めて, 日本語がコンピュータでそこそこ使えるようになったのは, 1978年に制定された, JIS X 0208 と呼ばれる文字コードです (JIS = Japan Industrial Standard: 日本工業規格). これは 7bit$\times$ 2 バイト(もしくは 8bit $\times$ 2)の文字コードでした. 問題になるのは, この文字コードに数字やアルファベットが定義されていたことです. つまり, ASCII コードと同じ文字が異なる数に対応するように JIS でも定義されました. コンピュータ自体, あるいはそれを動かす基本ソフトは, ほとんどの場合アメリカで開発されましたから, 当然, ASCII コードを基本とする処理系が作られます. 日本では, それに上の JIS X 0208を加えて動かすというシステムになりました. そのための工夫が, MS-KANJIだったり, EUCだったわけです.

その世界では, アルファベットの Aに対応する数が 2 種類あることになります. そこで, ASCII の文字幅を JIS X 0208の文字幅の半分で表示するフォント (Font, 文字の形を表示するためのデータ)が作られました. これが, 全角/半角という言葉の起源です.

しかし, プログラムなどを作る側から考えると, そのようなシステムは不便です. 「1」という文字を探すのにも, ASCII と JIS X 0208の 両方を探さなければいけないからです. また, プログラミングなどでは, プログラムで意味を持つ単語は, ASCII 文字を使うのが通常で, JIS X 0208 のような文字は, 文字列定数としてしか 使わないのが基本です.

現在, 上のような「ASCII + 現地語」のようなシステムは, ほぼ無くなっていると思います. しかし, 残念 ながら, Unicode を策定するときにも, 「複数の数が同じ文字に対応する」という愚行が継承されました. この授業では, HTML を講義する予定ですが, それ以外の場面でも私の授業では,

ASCII で定義されている文字は, 半角を利用する.
を守ってください. 前回の資料でも述べましたが, 特に邪悪なのが「全角の空白」です. これが原因でうまいかないことが往々にしてあり, 見えないので, 原因究明に時間がかかるのです. 他にも, 括弧などの記号とかにも注意してください.

前回の資料で,「全角の空白で位置揃えをするな」と書きました. ほとんどの場合, 位置揃えには全角空白以外の方法が用意されており, 位置揃えをすることを意識的に行えるようになっています. つまり,「全角の空白」 というのは, 全く存在価値のない文字なのです.

次の問は, 高校の数学 Aの復習です. レポート問題ではありませんが, 数理の学生としては, このくらいは できるようになっておいてください.


10 進法で 0.1 と表記される数を 2 進法で表すとどうなるか.

2024-04-26