HTML 入門 | HTML テキスト要素 | 文字セット (Character set)

Web ブラウザが HTML 文書を正しく表示するには、その文書がどの文字セットで保存されたかを知る必要がある。 そのため、HTML 文書の保存時に使用された文字セットの情報を、<head> タグ内の <meta> タグに明示する。

HTML4 で UTF-8 を使用する場合

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

HTML5 で UTF-8 を使用する場合

<meta charset="UTF-8">

上の 2 つの例は、その HTML 文書が UTF-8 文字セットを使用して保存されたことを Web ブラウザに伝える。

文字セットの種類

現在使用されている代表的な文字セット(character set)は次のとおりである。

  1. ASCII: 最初に作られた文字セットで、インターネットで使用できる 127 個の英字と数字で構成されている。
  2. ANSI: Windows が作成した文字セットで、合計 256 個の文字コードをサポートする。
  3. ISO-8859-1: 256 個の文字コードをサポートする HTML4 の基本文字セットである。
  4. UTF-8: 世界中のほぼすべての文字を表現できる Unicode 文字をサポートする HTML5 の基本文字セットである。