🐥

文字の表現方法

2023/08/29に公開

文字コード
文字に数値を割り当てる事

コンピュータは文字に数値を割り当てる事で文字データを表現する

パリティ
データがおかしくないか確認する方法の一つ

文字コードの代表的な種類
・ASCII
米国規格協会によって定められた基本的な文字コード
含まれる文字はアルファベットと数字、後はいくつかの記号で
1文字を7ビットで表す

・EBCDIC
IBM社が定めた文字コードで、8ビットを使って1文字を表す
大型の汎用コンピュータに使われてる

・シフトJISコード
ASCIIのコード体系の文字と混在させて使えるようになっている
日本語文字コード
ひらがなや漢字、カタカナなどが扱える
マイクロソフト社のOSであるWindowsでも使われており、
1文字を2バイトで表す

・ECU
拡張UNIXコードとも呼ばれ、UNIXというOS上でよく使われる日本語文字コードです
基本的には1文字を2バイトで表すが、補助漢字などでは3バイト使える
全角文字と半角カタカナ文字を2バイトの文字コード体系

・Unicode
全世界の文字コードを一つにと、各国のありとあらゆる文字を1つのコード体系で
表そうとした文字コード
当初は1文字を2バイトで表す予定でしたが、
それでは文字数が足りないという事で3バイト、4バイトと
どんどん拡張されている
1993年にISOで標準化されている
多国籍文字を扱うために、日本語や中国語などの形の似た文字を
同一コードに割り当てた2バイトの文字コード体系

・ASCII符号はアルファベット、数字、特殊文字及び制御文字からなり、
漢字に関する規定はない

・英語の大文字は26種類、数字は10種類あるので、合計36種類の文字種
1ビットは2種類の状態で表現できる
2ビットは2の2乗で4種類
2の5乗は32、2の6乗は64なので
36種類の種類を表現するには5ビットでは足らず6ビットが必要

Discussion