การจัดเก็บข้อมูล
2.4 การจัดเก็บข้อมูล
เมื่อเห็นความสำคัญของข้อมูลแล้ว ทำอย่างไรจึงจะเก็บรักษาข้อมูลเหล่านั้นให้คงอยู่ รวมถึงทำให้สามารถประมวลผลข้อมูลนั้นได้อย่างรวดเร็วโดยมากและจะรวมอยู่ใน ระบบฐานข้อมูล ซึ่งนำมาใช้ในการจัดเก็บการเข้าถึงและการประมวลผล
ข้อดีในการนำฐานข้อมูลเหล่านี้ไปใช้ในองค์กรหรือหน่วยงาน เช่น
- การจัดเก็บอย่างมีประสิทธิภาพ สามารถลดภาระการเก็บเอกสารที่เป้นกระดาษได้ รวมถึงการทำซ้ำเพื่อสำรองข้อมูล สามารถทำได้สะดวกและรวดเร็ว
- การตอบสนองต่อความต้องการได้อย่างรวดเร็ว เช่น ข้อมูลประวัติการบำรุงรักษารถยนต์และข้อมูลประวัติคนไข้ ผู้ใช้ที่ต้องการนำข้อมูลเหล่านี้ไปใช้งาน สามารถเข้าถึงระบบฐานข้อมูลและนำข้อมูลที่ต้องการไปใช้ได้
- การจำกัดสิทธิ์ในการเข้าถึงข้อมูลให้แก่ผู้ใช้ในแต่ละระดับขององค์กร เช่น ผู้บริหารสามารถเข้าถึงข้อมูลของทุกหน่วยงานได้ แต่ผู้ใช้ทั่วไปในแผนกการเงิน ไม่สามารถเข้าถึงข้อมูลประวิติของฝ่ายบุคคลได้ เป็นต้น
รูปที่ 2.14 ข้อดีในการนำฐานข้อมูลไปใช้ในองค์กร (http://www.thaigoodview.com/library/contest2552/type2/tech04/22/cit/pic/082.jpg)
2.4.1 ลำดับชั้นของข้อมูลในฐานข้อมูล ก่อนจะกล่าวถึงลำดับชั้นของข้อมูลในฐานข้อมูลสื่งแรกที่ต้องกล่าวถึงก่อน คือ ลำดับชั้นล่างสุดของการแทนข้อมูล นั่นคือ การแทนข้อมูลด้วยตัวเลขฐานสอง ซึ่งประกอบด้วยตัวเลขสองตัว คือ
' 0 ' และ '1' ในทางคอมพิวเตอร์ จะเรียกตัวเลขฐานสองหนึ่งหลักนี้ว่า 1 บิต (bit) ซึ่งถือว่าเป็นหน่วยเล็กที่สุดของข้อมูล และหากนำบิตมาต่อกันจำนวน 8 บิต จะเรียกว่า 1 ไบต์ (byte) ตัวอย่างทารแทนข้อมูลทางคอมพิวเตอร์ ดังรูปที่ 2.15
1. เขตข้อมูล (field) เมื่อนำข้อมูลระดับบิตมาเรียงต่อกันเพื่อแทนข้อมูลใดๆ ที่ต้องการเก็บในฐานข้อมูล เราจะจัดข้อมูลที่เป็นบิตนี้มารวมกันเพื่อแทนความหมายบางอย่าง หน่วยย่อยที่สุดที่มีความหมายในฐานข้อมูลนี้เรียกว่า เขตข้อมูล
โดยเขตข้อมูลอาจแทนข้อมูลดังตัวอย่างต่อไปนี้
- จำนวนเต็ม (interger) คอมพิวเตอร์ส่วนใหญ่จะเก็บตัวเลขขนาด 32 บิต ซึ่งขนาดของตัวเลขนี้อาจเปลี่ยนแปลงไปตามเทคโนโลยีของเครื่องคอมพิวเตอร์ ตัวเลขฐานสองขนาด 32 บิต สามารถแทนตัวเลขจำนวนเต็มได้ตั้งแต่ -2,147,483,
648 ถึง 2,147,483,647 แต่ถ้าเป็นเขตข้อมูลที่ระบุไว้ว่า เป็นตัวเลขจำนวนเต็มไม่ระบุเครื่องหมาย (unsigned integer) เท่านั้นจะสามารถแทนตัวเลขจำนวนเต็มได้ตั้งแต่ 0 ถึง 4,294,967,295
- จำนวนทศนิยม (decimal number) ใรคอมพิวเตอร์ จะเก็บตัวเลขทศนิยม โดยใช้ระบบโฟลททิงพอยต์ (floating piont) ซึ่งการเก็บในลักษณะนี้ ไม่มีการกำหนดตำแหน่งตายตัวสำหรับตำแน่งของจุด โดยทั่วไปการเก็บข้อมูลตัวเลขจะมีสองขนาด คือ 32 บิต และ 64 บิต
- ข้อความ (text) ในการแทนข้อความนั้น จะต้องเปลี่ยนข้อความให้เป็นรหัสซึ่งใช้แทนตัวอักขระแต่ละตัวเสียก่อน ตามมาตรฐานโดยทั่วไปจะใช้เป็นรหัสแอสกี (ASCII code) ซึ่งต่อมามีการใช้รหัสแบบยูนิโคด (Unicode) ที่สามารถแทนภาษได้หลายภาษามากกว่ารหัสแอสกี
ความยาวของเขตข้อมูลประเภทนี้ ขึ้นอยู่กับจำนวนตัวอักขระในข้อความ
- วันเวลา (date/time) ข้อมูลที่เป็นวันเวลา เช่น วันที่เริ่มใช้งาน วันลงทะเบียน และเวลาที่ซื้อสินค้า มีความแตกต่างจากข้อมูลประเภทอื่น ดังนั้นจึงต้องมีชนิดของข้อมูลเป็นวันเวลา เพื่อรองรับเขตข้อมูลที่ต้องการเก็บข้อมูลเป็นวันเวลา
- ไฟล์ (file) เขตข้อมูลบางประเภทใช้เก็บไฟล์รูปภาพหรือไฟล์อื่นๆซึ่งเขตข้อมูลประเภทนี้จะ เป็นเขตข้อมูลขนาดใหญ่ โดยปกติแล้วจะมีความยาวมากกว่าเขตข้อมูลประเภทอื่นๆ โดยเขตข้อมูลนี้จะเก็บข้อมูลในลักษณะเป็นบิตเรียงต่อกัน
2. ระเบียน (record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน โดยเขตข้อมูลแต่ละส่วนอาจจะเป็นข้อมูลต่างชนิดกัน ระเบียนแต่ละระเบียนจะประกอบด้วยโครงสร้างเขตข้อมูลที่เหมือนกัน ตัวอย่างระเบียน ดังรูปที่ 2.16
รูปที่ 2.16 ตัวอย่างระเบียน (http://61.7.157.234/pornsak/41201/images/pet.gif)
3. ตาราง (table) คือ กลุ่มของระเบียน ซึ่งเขตข้อมูลในแต่ละระเบียนจะเก็บข้อมูลที่มีความสัมพันธ์กัน ในตารางจะเก็บข้อมูลหลายๆระเบียน แต่ละระเบียนจะมีโครงสร้างเหมือนกันในตาราง นอกจากจะเก็บข้อมูลหลายระเบียนแล้ว ยังสามารถอ้างถีงระเบียนแต่ละระเบียนได้อีกด้วย ตัวอย่างตารางข้อมูลนักเรียน ดังรูปที่ 2.17
รูปที่ 2.17 ตัวอย่างข้อมูลนักเรียน http://school.obec.go.th/muangkrabi/webbased/picture/image025.jpg
4. ฐานข้อมูล(database)เป็นที่รวมของตารางหลายๆ ตารางเข้าไว้ด้วยกัน ตารางแต่ละตารางจะมีความสัมพันธ์กันโดยใช้เขตข้อมูลที่เก็บข้อมูลซึ่งเหมือน กันเป็นตัวเชื่อมโยงระหว่างกัน บางตารางอาจเป็นตารางที่เก็บข้อมูลไว้เฉพาะของตนเองโดยไม่เกี่ยวข้องกับ ตารางอื่น ในขณะที่บางตาราง อาจต้องเชื่อมโยงกับเขตข้อมูลของตารางอื่น