ลักษณะของข้อมูลที่ดี
2.3 ลักษณะของข้อมูลที่ดี
มีคำกล่าวเกี่ยวกับการประมวลผลข้อมูลไว้อย่างน่าฟังว่า ถ้าข้อมูลเข้าเป็นขยะ สื่งทีออกมาก็จะเป็นขยะด้วย (Garbage In , Garbage Out) ซึ่งหมายความว่า ถ้าข้อมูลที่นำไปประมวลผลเป็นข้อมูลที่ด้อยคุณภาพ ผลลัพธ์ที่ออกมาก็ย่อมด้อยคุณภาพไปด้วย ดังนั้นเราควรจะตระหนักถึงความสำคัญของการเก็บข้อมูล รวมถึงการประมวลผลข้อมูลเบื้องต้นด้วย
1. ความถูกต้องของข้อมูล เป็นลักษณะสำคัญยิ่งของข้อมูล ถ้าข้อมูลไม่ถูกต้องแล้ว เราจะไม่สามารถได้ผลลัพธ์ที่ถูกต้องได้เลย ซึ่งประเด็นนี้เป็นเรื่องสำคัญที่เกิดขึ้นโดยเฉพาะอย่างยิ่งกับข้อมูลที่มี ขนาดใหญ่ และไม่มีการตรวจสอบ เช่น ข้อมูลในโลกอินเทอร์เน็ต
ซึ่งจำเป็นต้องได้รับการตรวจสอบก่อนนำมาใช้เสมอ
นอกจากนี้ข้อมูลบางประเภท เช่น ข้อมูลเสียงที่เก็บจากไมโครโฟน ดังรูปที่ 2.8 อาจมีปัญหาเกี่ยวกับสัญญาณเสียงรบกวนเกิดขึ้นดังนั้นข้อมูลประเภทนี้ จึงต้องได้รับการปรับปรุงคุณภาพหรือเรียกว่า กระบวนการลดสัญญาณรบกวน จึงจะสามารถนำมาใช้งานได้
รูปที่ 2.8 ข้อมูลเสียงที่เก็บจากไมโครโฟน (http://www.chontech.ac.th/~electric/e-learn/unit8/pic/l20.gif)(http://www.carabao.net/Images/bio020.jpg)
สำหรับข้อมูลที่ได้บการบันทึกด้วยมนุษย์โดยมากมักต้องผ่านการตรวจสอบก่อน เสมอ ซึ่งอาจตรวจสอบโดยมนุษย์ หรือตรวจสอบโดยระบบ ตัวอย่างเช่น ข้อมูลที่มีความสำคัญอาจต้องป้อนสองครั้ง เพื่อป้องกันความผิดพลาดซึ่งนักเรียนสามารถเห็นตัวอย่างของข้อมูลเหล่านี้ ได้จากการป้อนรหัสผ่านเวลาลงทะเบียนตามเว็บไซต์ต่างๆ
ที่นีกเรียนต้องป้อนรหัสหรืออีเมลสองครั้ง เพื่อป้องกันข้อผิดพลาด ดังรูปที่ 2.9 นอกจากนี้ข้อมูลที่เป็นรหัสตัวเลขสำคัญ มักจะมีตัวเลขซึ่งเป็นหลักตรวจสอบแฝงไว้เสมอ เช่น ข้อมูลหมายเลขบัตรเครดิต 16 หลัก เมื่อนำมาผ่านกระบวนการประมวลผล จะสามารถตรวจสอบได้ว่า หมายเลขบัตรเครดิตนั้นถูกต้องหรือไม่ เป็นต้น
รูปที่ 2.9 แสดงหน้าจอของเว็บไซต์ที่ต้องป้อนข้อมูลสองครั้ง เพื่อป้องกันความผิดพลาด (จากหน้าต่าง http://www.imeem.com)
2. ความสมบูรณ์ครบถ้วนในการนำไปใช้งาน ข้อมูลบางประเภทหากไม่ครบถ้วน จัดเป็นข้อมูลที่ด้อยคุณภาพได้เช่นกัน เช่น ข้อมูลประวัติคนไข้ หากไม่มีหมูเลือดของคนไข้ จะไม่สามารถใช้ได้ในกรณีที่ผู้ร้องขอข้อมูลต้องการข้อมูลหมู่เลือดของคนไข้ หรือข้อมูลที่อยู่ของลูกค้า ที่กรอกผ่านแบบฟอร์ม ถ้ามีชื่อและนามสกุลโดยไม่มีข้อมูลบ้านเลขที่ ถนน แขวง/ตำบล เขต/หรือจังหวัด ข้อมูลเหล่านั้นก็ไม่สามารถนำมาใช้ได้เช่นกัน ตัวอย่างข้อมูลที่ไม่ครบถ้วน ดังรูปที่ 2.10
รูปที่ 2.10 ตัวอย่างข้อมูลที่ไม่ครบถ้วน (http://web.pointasia.com/th/forum/upload/userFile/114.jpg)
ข้อมูลการติดตามตำแหน่งของรถยนต์ด้วยระบบจีพีเอส ดังแสดงในรูปที่ 2.11 สำหรับบริษัทที่ต้องทำงานติดตามรถยนต์ ข้อมูลตำแหน่งรถยนต์ จะต้องได้รับการปรับให้เป็นจริงตลิดเวลา หากข้อมูลนั้นปรับทุกๆหนึ่งชั่วโมง จะไม่มีประโยชน์ในการติดตามตำแหน่งของรถยนต์ ดังนั้นในเรื่องความถูกต้องตามเวลาของข้อมูล จึงเป็นเรื่องสำคัญประการหนึ่งที่ต้องนำมาพิจารณาเมื่อ
ต้องมีการจัดเก็บข้อมูลหรือประมวลผลข้อมูล
รูปที่ 2.11 ระบบติดตามรถยนต์ด้วยจีพีเอส (http://www.nectec.or.th/rd/electronics/be205-45/images/Resize%20of%2001.jpg)
3. ความถูกต้องตามเวลา ในบางกรณีข้อมูลผูกอยู่กับเงื่อนไขของเวลา ซึ่งถ้าผิดจากเงื่อนไขของเวลาไปแล้ว ข้อมูลนั้นอาจลดคุณภาพลงไป หรือแม้กระทั่งไม่สามารถใช้ได้ เช่น ข้อมูลการให้ยาของคนไข้ในโรงพยาบาล ดังรูปที่ 2.12 ในทางการแพทย์แล้ว ข้อมูลนี้จะต้องถูกใส่เข้าไปในฐานข้อมูลที่คนไข้ได้รับยาเพื่อให้แพทย์คน อื่นๆ ได้ทราบว่า คนไข้ได้รับยาชนิดนี้เข้าไปแล้ว แต่ข้แมูลเรื่องการให้ยาของคนไข้นี้ อาจไม่จำเป็นต้องได้รับการปรับทันที
สำหรับแผนกการเงิน เพราะแผนกการเงินจะคิดเงินก็ต่อเมื่อญาติคนไข้มาตรวจสอบ หรือคนไข้กำลังออกจากโรงพยาบาล
รูปที่ 2.12 ตัวอย่างข้อมูลการให้ยาคนไข้ในโรงพยาบาล (http://www.talkystory.com/imagelib/www.talkystory.com/082009/4ecdc43b6e28249.jpg)
4. ความสอดคล้องกันของข้อมูล ในกรณที่ข้อมูลมาจากหลายแหล่ง จะเกิดปัญหาขค้นในเรื่องของความสอดคล้องกันของข้อมูล เช่น ในบริษัทแห่งหนึ่งซึ่งเก็บข้อมูลที่อยู่ลูกค้า หากต้องการนำข้อมูลไปควบรวมกับบริษัทอีกแห่งหนึ่งซึ่งมีข้อมูลของลูกค้าอยู่ เช่นกัน แต่ข้อมูลในการจัดส่งเอกสารของบริษัทแห่งแรก เป็นที่อยุ่ที่พักอาศัยของลูกค้า ในขณะที่ข้อมูลในบริษัทที่สองเป็นที่อยู่ของสถานที่ทำงานลูกค้า ข้อมูลจากทั้งสองบริษัทนี้เป็นข้อมูลที่ถูกต้อง
สอดคล้องตามเวลาทั้งคู่ แต่ถ้าต้องการเก็ยข้อมูลที่อยู่ลูกค้าเพียงที่อยู่เดียว ก็จะเกิดปัญหาขึ้นได้ ตัวอย่างของการไม่สอดคล้องกันของข้อมูล ดังรูปที่ 2.13
รูปที่ 2.13 ตัวอย่างของการไม่สอดคล้องกันของข้อมูล (http://www.oknation.net/blog/home/blog_data/532/34532/images/Econ/pfund/Insider.jpg)