menu

文字コードについて(UTF-8/Shift_JIS/EUC-JP)

2020年9月14日

文字コードとは?
文字コードとは、コンピューターで「文字」や「記号」を表現するために、個別に割り当てられた「固有の番号」のことを指します。欧米の英数字を表すものや、漢字を含む日本語を表すものなど、文字コードにはそれぞれ種類があります。日本語を表す文字コードは、JIS、Shift_JIS、ECU-JP、UTF-8などが用いられています。

文字コードの歴史
コンピューターが登場した頃は、英語しか扱うことが出来ませんでした。そこで、その他の言語も表示できるように国や各メーカーが独自開発したものが現在の文字コードです。その後、世界中でコンピューターの普及が進み、各国でバラバラに作成した文字コードに互換性を持たせるため、「Unicode(ユニコード)」が開発されました。Unicodeは、英語、日本語、ロシア語、記号など、世界中の文字に対して番号を割り振り、利用できるようにした文字集合体です。現在、Unicodeは文字コードの業界規格になっています。

UTF-8

  • UTF-8(ユーティーエフエイト)は、Unicodeで割り振られた数字をコンピュータが理解できるように変換する方式の一つです。Unicodeで定義された数値を変換するため、世界中の文字を表現することが可能です。そのため、UTF-8は世界で最も使われており、世界標準の文字コードとされています。

Shift_JIS

  • Shift_JIS(シフトジス)はMicrosoft社が日本語を表示させるために開発した文字コードで、WindowsやMacなど、多くのコンピューターで使用されています。日本語を扱う文字コードとして広く利用されていますが、使い方によっては文字化けするなどのデメリットがあります。

EUC-JP

  • EUC-JP(イーユーシージェーピー)は、UNIX系のOSで日本語を表示する時に使用される文字コードのうちのひとつです。WindowsやMacでもウェブブラウザで表示することが可能ですが、テキストエディタでは対応していない場合があります。


まとめ
今回は、文字コードについてご紹介しました。
テキストファイルやWebサイトなどで、文字化けに遭遇したことがある方も多いのではないでしょうか。文字化けは文字コードの違いで発生するため、文字コードという概念を押さえておくと文字化けを回避することが出来ます。

Web制作において、もし、利用する文字コードで迷った時は「UTF-8」の利用を検討してみて下さい。UTF-8は世界中の言語に対応しているため、どの環境で見ても文字化けの心配がありません。ですので、特に理由がない場合は「UTF-8」の利用がオススメですよ。

CPTIMES

   

投稿一覧

pagetop