วันอาทิตย์ที่ 14 กรกฎาคม พ.ศ. 2556

รหัสASCII และรหัสUNICODE





รหัส ASCII

   รหัสAmericanคือAmericanStandard
Code for Information Interchange (ASCII) อ่านว่า แอส-กี้ เป็นรหัสที่พัฒนาขึ้นโดยสถาบันมาตรฐานแห่งชาติสหรัฐอเมริกา 
(American National Standard Institute: ANSI อ่านว่า แอน-ซาย) เรียกว่า ASCII Code ซึ่งเป็นที่นิยมในกลุ่มผู้สร้างเครื่องคอมพิวเตอร์ทั่วไป รหัสนี้ได้มาจากรหัสขององค์กรมาตรฐานระหว่างประเทศ (InternationalStandardization Organization: ISO)

     ขนาด7บิต ซึ่งสามารถสร้างรหัสที่แตกต่าง กันได้ถึง128รหัส
(ตั้งแต่ 000 0000 ถึง 111 1111)โดยกำหนดให้32รหัสแรกเป็น 000 0000 ถึง 001 1111)ทำหน้าที่เป็นสั่งควบคุมเช่นรหัส 000 1010 แทนการเลื่อนบรรทัดในเคื่องพิมพ์เป็นต้นและอีก96รหัสถัดไป(32"95)ใช้แทนอักษรและสัญญาลักษณ์พิเศษอื่นรหัสASCIIใช้วิธีการกำหนดการแทนรหัสเป็นเลขฐานสิบหก ทำให้ง่ายต่อการจำและการใช้งาน

     นอกจากนั้นยังสามารถเขียนมนรูปของเลขฐานสิบหกได้ด้วย ดังนั้นASCII Codeจีงเป็ฯรหัสที่เขียนได้3แบบ เช่นอักษรAสามารถแทนเป็นรหัสได้ดังนี้

สัญลักษณ์
เลขฐานสิบ
เลขฐานสอง
เลขฐานสิบหก
A
65
100 0001
4 1
รหัส ASCII สามารถใช้แทนข้อมูลอักขระและคำสั่งได้มากขึ้น และมีการขยายเป็นรหัสแบบ 8 บิต
ตารางแสดงรหัสASCII


Unicode

ยูนิโค๊ด คือ รหัสคอมพิวเตอร์ใช้แทนตัวอักขระ สามารถใช้แทน ตัวอักษร,ตัวเลข,สัญลักษณ์ต่างๆ ได้มากกว่ารหัสแบบเก่าอย่าง  ASCII ซึ่งเก็บตัวอักษรได้สูงสุดเพียง 256 ตัว(รูปแบบ) โดย Unicode รุ่นปัจจุบันสามารถเก็บตัวอักษรได้ถึง 34,168 ตัวจากภาษาทั้งหมดทั่วโลก 24 ภาษา โดยไม่สนใจว่าเป็นแพลตฟอร์มใด ไม่ขึ้นกับโปรแกรมใด หรือภาษาใด unicodeได้ถูกนำไปใช้โดยผู้นำในอุตสาหกรรมเช่นApple,hp.IBM,Microsoft,Unixฯลฯและแนวทางอย่างเป็นทางการในการทำISO/IEC
  10646 ดังนั้น Unicode จึงถือเป็นมาตรฐานในการกำหนดรหัส สำหรับทุกตัวอักษร ทุกอักขระ  unicode ทำให้ข้อมูลสามารถเคลื่อนย้ายไปมาในหลายๆ ระบบ ข้ามแพลตฟอร์มไปมา หรือข้ามโปรแกรมได้อย่างสะดวก โดยไร้ข้อจำกัด

Unicode ต่างจาก ASCII
 
คือ ASCII เก็บ byte เดียว แต่ Unicode เก็บ 2 byte ซึ่งข้อมูล 2 byte เก็บข้อมูลได้มากมายมหาศาล สามารถเก็บข้อมูลได้มากมายหลายภาษาในโลก
 

อย่างภาษาไทยก็อยู่ใน Unicode นี้ด้วยเหมือนกัน ดังนั้นรหัสภาษาไทยเอาไปเปิดในภาษาจีน ก็ยังเป็นภาษาไทยอยู่ ไม่ออกมาเป็นภาษาจีน เพราะว่ามี code ตายตัวอยู่ว่า code นี้จองไว้สำหรับภาษาไทย แล้ว code ตรงช่วงนั้นเป็นภาษาจีน ตรงโน่นเป็นภาษาญี่ปุ่น จะไม่ใช้ที่ซ้ำกัน เป็นต้น


 ตารางแสดงรหัสUnicode





ไม่มีความคิดเห็น:

แสดงความคิดเห็น