ชุดอักขระ (character set) ที่ใช้ในการเข้ารหัสตัวอักษร

  • ASCII: ชุดอักขระ ASCII รองรับเฉพาะตัวอักษรภาษาอังกฤษ (7 หรือ 8 บิต) ไม่สามารถรองรับตัวอักษรไทยได้
  • EBCDIC: ชุดอักขระ EBCDIC ใช้ในระบบเมนเฟรมของ IBM รองรับตัวอักษรภาษาอังกฤษเป็นหลัก ไม่รองรับภาษาไทย
  • EUC: EUC (Extended Unix Code) เป็นชุดอักขระที่ออกแบบมาเพื่อรองรับภาษาในเอเชีย เช่น ญี่ปุ่น จีน และเกาหลี แต่ไม่รองรับภาษาไทยโดยตรง
  • Unicode: Unicode เป็นชุดอักขระสากลที่รองรับตัวอักษรจากทุกภาษาทั่วโลก รวมถึงภาษาไทย