为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。

1. 从 ASCII 到 UTF-8

ASCII 是第一个字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符,比如:! $ + - ( ) @ < >。

ISO-8859-1 是 HTML 4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML 4 同时支持 UTF-8。

ANSI(Windows-1252)是原始的 Windows 字符集。 ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个额外的字符。

HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号!

. HTML charset 属性

这在 <meta> 标签中指定:

<meta charset="UTF-8">

2. 字符集之间的差异


3. ASCII 字符集

ASCII 使用 0 到 31(以及 127)之间的值作为控制字符。

ASCII 使用 32 到 126 的值表示字母、数字和符号。

ASCII 不使用 128 到 255 之间的值。

4. ANSI 字符集 (Windows-1252)

对于 0 到 127 的值,ANSI 与 ASCII 相同。

ANSI 有一组专有的字符,其值从 128 到 159。

对于 160 到 255 的值,ANSI 与 UTF-8 相同。

5. ISO-8859-1 字符集

对于 0 到 127 的值,8859-1 与 ASCII 相同。

8859-1 不使用 128 到 159 之间的值。

对于从 160 到 255 的值,8859-1 与 UTF-8 相同。

6. UTF-8 字符集

对于 0 到 127 的值,UTF-8 与 ASCII 相同。

UTF-8 不使用 12 8到 159 之间的值。

对于 160 到 255 之间的值,UTF-8 与 ANSI 和 8859-1 相同。

UTF-8 从值 256 继续,包含超过 10000 个不同字符。

如需深入研究,请阅读我们完整的 HTML 字符集参考手册。

7. @charset CSS 规则

您可以使用 CSS @charset 规则来指定样式表中使用的字符编码:


将样式表的编码设置为 Unicode UTF-8:

@charset "UTF-8";

