😺

文字コードに関して💻

2023/06/10に公開

プログラミングをしているとちょくちょく文字化けに遭遇しますよね。
文字化けを解消するためにはデータの文字コードと開く側の
文字コードを揃えるみたいなことは分かっていても、そもそも文字コードが
どういう仕組みでできているのか迄は知らなかったので調べたものを纏めておきます。

文字コードとは

文字にはそれぞれ別々のビットパターン(A -> 01000001 B -> 01000010等)
が割り当てられている。この何の文字にどのビットパターンを割り振るかルール決め
したものを文字コードと呼んでいる。
単純に文字コードによってビットパターンの割り振りが変わるので、
文字コードが揃っていないと、違う文字が表示(文字化け)されてしまう。

主な文字コード

1.ASCII アメリカで定められた文字コード
2.JIS 日本産業規格が定めた文字コード
3.シフトJIS JISの進化版。①やローマ数字が使われるようになった。
4.EUC UNIXで使うための文字コード
5.Unicode 世界中の文字を統一。UTF-8やUTF-16などがる。顔文字も使えるようになった。

Discussion