เว็บเบราว์เซอร์จำเป็นต้องทราบว่าในหน้าเพจนั้นใช้ ชุดอักขระ (Character Set) แบบใด หากไม่ได้ระบุไว้ เบราว์เซอร์อาจแสดงตัวอักษรผิดเพี้ยนหรืออ่านไม่ออก โดยเราสามารถระบุได้ในแท็ก
<meta> ASCII
ASCII เป็นชุดอักขระมาตรฐานชุดแรกของอินเทอร์เน็ต
มีอักขระทั้งหมด 128 ตัว ประกอบด้วย
- ตัวเลข:
0–9 - ตัวอักษรภาษาอังกฤษ:
A–Z,a–z - เครื่องหมายพิเศษ:
!,$,+,-,( ),@,<,>
ชุดอักขระ ANSI
ANSI (Windows-1252) เป็นชุดอักขระแรกของระบบ Windows
- เหมือนกับ ASCII สำหรับ 127 ตัวแรก
- มีอักขระพิเศษตั้งแต่ 128 ถึง 159
- เหมือนกับ UTF-8 ตั้งแต่ 160 ถึง 255
ISO-8859-1
ISO-8859-1 เป็นชุดอักขระเริ่มต้นสำหรับ HTML 4
รองรับ 256 ตัวอักษร
- เหมือนกับ ASCII สำหรับ 127 ตัวแรก
- ไม่ได้ใช้อักขระตั้งแต่ 128 ถึง 159
- เหมือนกับ ANSI และ UTF-8 ตั้งแต่ 160 ถึง 255
ตัวอย่าง HTML 4:
ตัวอย่าง HTML 5:
UTF-8
- เหมือนกับ ASCII สำหรับค่าตั้งแต่ 0 ถึง 127
- ไม่ได้ใช้อักขระตั้งแต่ 128 ถึง 159
- เหมือนกับ ANSI และ 8859-1 ตั้งแต่ 160 ถึง 255
- ขยายต่อเนื่องจากค่า 256 ถึงมากกว่า 10,000 ตัวอักษร