February 14, 2013

การกำหนด charset (tis-620, utf-8) ให้กับ Web page

สำหรับผู้ที่สงสัยว่าการกำหนด charset ให้กับหน้าเว็บที่มีภาษาไทยนั้น ควรกำหนดเป็น tis-620 หรือ utf-8 หรือ windows-874 แบบไหนจะดีกว่ากัน

ผมจึงได้ลองทดสอบเทียบกันดู (แต่ได้ตัด windows-874 ออก เพราะคิดว่ามันเป็นมาตรฐานเฉพาะของ Microsoft เท่านั้น)

ผมได้สร้างไฟล์ที่มี Tag <meta http-equiv="content-Type" content="text/html; charset=tis-620">
แล้วลองใช้ charset 3 แบบ คือ ไม่กำหนด, tis-620 และ utf-8

แล้วบันทึกเป็นแบบ ANSI, Unicode, UTF-8 ด้วย Notepad
จากนั้นใช้ Firefox เปิดดู แล้วตรวจสอบว่าภาษาไทยอ่านออกหรือไม่ และดูว่า Firefox เลือก Encoding ให้เป็นแบบใด

การเข้ารหัสตัวอักษรไทย แบบ ANSI, Unicode และ UTF-8

หากเราสร้างไฟล์ที่มีภาษาไทยด้วย Notepad
แล้วสั่งบันทึก หรือสั่ง Save As จะมีถามให้เลือก Encoding 4 แบบ
-ANSI
-Unicode
-Unicode big endian
-UTF-8
แล้วเราควรจะเลือกแบบไหน?
มาลองดูกันครับ