HTML 入門 | HTML テキスト要素 | 文字セット (Character set)
Web ブラウザが HTML 文書を正しく表示するには、その文書がどの文字セットで保存されたかを知る必要がある。
そのため、HTML 文書の保存時に使用された文字セットの情報を、<head> タグ内の <meta> タグに明示する。
HTML4 で UTF-8 を使用する場合
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
HTML5 で UTF-8 を使用する場合
<meta charset="UTF-8">
上の 2 つの例は、その HTML 文書が UTF-8 文字セットを使用して保存されたことを Web ブラウザに伝える。
文字セットの種類
現在使用されている代表的な文字セット(character set)は次のとおりである。
- ASCII: 最初に作られた文字セットで、インターネットで使用できる 127 個の英字と数字で構成されている。
- ANSI: Windows が作成した文字セットで、合計 256 個の文字コードをサポートする。
- ISO-8859-1: 256 個の文字コードをサポートする HTML4 の基本文字セットである。
- UTF-8: 世界中のほぼすべての文字を表現できる Unicode 文字をサポートする HTML5 の基本文字セットである。