การแทนข้อมูล
การแทนข้อมูล
จากที่กล่าวมาแล้วว่า สารสนเทศคือข้อมูลที่ได้ผ่านการประมวลผล การประมวลผลข้อมูลส่วนใหญ่จะใช้เครื่องคอมพิวเตอร์ช่วยเพื่อ ความรวดเร็ว แม่นยำ ดังนั้นข้อมูลที่เก็บรวบรวมมาเพื่อให้คอมพิวเตอร์ประมวลผลจะต้องอยู่ในรูปแบบที่คอมพิวเตอร์เข้าใจ จึงจำเป็นต้องหาวิธีการแทนข้อมูลซึ่งเป็นชุดของตัวอักขระดังกล่าว
ปกติการทำงานของเครื่องคอมพิวเตอร์ ใช้สัญญาณอิเลกทรอนิกส์ ซึ่งมีสองสถานะ คือ ปิด และ เปิด จึงมีการกำหนดให้ใช้ตัวเลข 0 และ 1 แทนสถานะทั้งสอง แล ะมีการกำหนดรหัสแทนอักขระด้วยชุดของตัวเลขซึ่งประกอบด้วย 0 และ 1 ซึ่งเป็นตัวเลขในระบบเลขฐานสอง(ninary digit)
ตัวเลขแต่ละหลักของจำนวนในระบบเลขฐานสองเราเรียนกว่า บิต (bit) ดังนั้นจำนวน 1011 จึงเป็นเลขฐานสองที่มีจำนวน 4 บิต การใช้เลขฐานสองมาแทนอักขระต่าง ๆ จะพบว่า ถ้าใช้ตัวเลขฐานสอง 1 บิต จะแทนข้อมูลได้ 2 แบบ คือ 0 และ 1 ถ้าใช้ตัวเลขฐานสอง 4 บิต จะแทนอักขระได้ทั้งหมด 16 แบบ ดังนี้
0000 |
0001 |
0010 |
0011 |
0100 |
0101 |
0110 |
0111 |
1000 |
1001 |
1010 |
1011 |
1100 |
1101 |
1110 |
1111 |
เพื่อให้การแทนอักขระต่าง ๆ ด้วยตัวเลขฐานสองได้ครบ จึงมีการกำหนดให้ใช้ตัวเลขฐานสอง 8 บิต ซึ่งเรียกว่า 1 ไบต์ (byte) แทนตัวอักษร 1 ตัวเช่น 10000010 ใช้แทนอักษร A , 01000010 ใช้แทนอักษร B
รหัสที่ใช้แทนตัวอักขระที่เป็นมาตรฐานแบบหนึ่ง เรียกว่า รหัสแอสกี (American Standard Code for Information Interchange : ASCII) ตัวเลขฐานสอง 8 บิต หรือ 1 ไบต์ สามารถใช้แทนรหัสต่าง ๆ ได้ถึง 256 ตัว แต่รหัสตัวอักษรภาษาอังกฤษทั้งหมดมีจำนวนรวมกันไม่เกิน 128 ตัว ดังนั้น สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมจึงได้กำหนดรหัสภาษาไทยเพิ่มเติมเพื่อให้ใช้ในงานสารสนเทศเป็นภาษาไทยได้ เช่น 10000101 ใช้แทน ก รหัสแอสกีที่มีรหัสภาษาไทย
ข้อมูลตัวเลขมีวิธีเก็บที่หลากหลายมากว่าข้อมูลตัวอักษรเนื่องจากข้อมูลประเภทนี้มีรายละเอียดมากว่า และการเก็บข้อมูลยังขึ้นอยู่กับวัตถุประสงค์ของการใช้งานด้วย หากจะเก็บให้อยู่ในรูปรหัสที่ง่ายต่อการคำนวณ ก็อาจแยกข้อมูลออกเป็นค่าบวก และค่าลบ และนอกจากนี้ยังมีการจัดเก็บในลักษณะของจำนวนเต็ม และจำนวนจริง
สำหรับตัวเลขฐานสิบที่เป็นจำนวนเต็มสามารถเก็บเป็นตัวเลขฐานสอง หรือเก็บเป็นรหัสต่าง ๆ เช่น รหัสบีซีดี หรือ เอ็คเซสสาม