วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

Lecture 8 : Data Management

Data and Information
                Data คือ ข้อเท็จจริง ซึ่งหาได้จากแหล่งข้อมูลต่างๆ เป็นข้อมูลที่ยังไม่ผ่านกระบวนการใดๆ จึงเป็นข้อมูลพื้นฐานที่ยังไม่มีความหมาย หรือยังไม่สามารถสื่อความหมายได้ด้วยตนเอง
Information คือ การนำ Data มาผ่านกระบวนการต่างๆ (Process) ให้สามารถสื่อความหมายเพื่อให้นำไปใช้ประโยชน์ได้
                ดังนั้นข้อความใดๆจะถูกกำหนดให้เป็น Data หรือ Information นั้นขึ้นอยู่กับผู้รับ หากผู้รับเป็นผู้มีส่วนได้เสียในข้อความนั้น ข้อความนั้นก็จะเป็น Information
Information System คือ ระบบที่ทำหน้าที่รวบรวมข้อมูลเพื่อนำมาประมวลผล วิเคราะห์เพื่อสร้างสารสนเทศให้กับผู้ที่ต้องการ รวมถึงการจัดเก็บบันทึกข้อมูลที่นำเข้าสู่ระบบเพื่อการใช้งาน โดย Information System มี 6 องค์ประกอบ ได้แก่
            1. Hardware
            2. Software
            3. Data
            4. Network
            5. Procedure
            6. People

Data Management
                การจัดการข้อมูลมีความยากลำบากเนื่องจากสาเหตุต่างๆ เช่น ข้อมูลมีจำนวนมากขึ้น ข้อมูลมีการกระจัดกระจาย และมีความซ้ำซ้อน ความปลอดภัยของข้อมูล คุณภาพ จริยธรรม อีกทั้งการจัดการข้อมูลจากภายนอกที่ใช้ในการตัดสินใจเป็นข้อมูลที่เราไม่มีอำนาจในการควบคุม โดย Data Management แบ่งออกเป็น 4 ส่วน ได้แก่
·        Data profiling เป็นข้อมูลเบื้องต้นของข้อมูลที่จัดเก็บ
·        Data quality management เป็นการปรับปรุงคุณภาพของข้อมูล
·        Data integration เป็นการรวบรวมข้อมูลที่เหมือนกันจากแหล่งที่มาที่หลากหลาย
·        Data augment เป็นการปรับปรุงคุณค่าของข้อมูล

Data Life cycle process
แบ่งออกเป็น 4 ขั้นตอน ได้แก่
·        เก็บรวบรวมข้อมูลจากหลายแหล่งที่มา โดยสามารถเก็บข้อมูลได้จาก 3 แหล่ง คือ Internal Data , External Data และ Personal Data
·        จัดเก็บข้อมูลที่ต้องการใช้มารวมกันที่ Data Warehouse
·        ผู้ที่ต้องการใช้ข้อมูลเข้าที่ Data Warehouse และทำการคัดลอกเพื่อเอาไปใช้ในการวิเคราะห์
·        ใช้เครื่องมือในการวิเคราะห์ เช่น OLAP , EIS , DSS เป็นต้น เข้ามาช่วยในการวิเคราะห์ข้อมูล

Data Processing
·        Transactional เป็นระบบปฏิบัติการที่ใช้ TPS ในจัดเก็บข้อมูลและแปลผลจากส่วนกลาง
·        Analytical เป็นระบบการวิเคราะห์ข้อมูลที่รวบรวมมาจากหลายแหล่ง ส่วนใหญ่มาจาก End-Users เช่น DSS, EIS, Web เป็น

Data Warehouse
                Data Warehouse เป็นแหล่งเก็บข้อมูลที่ได้ทำการคัดเลือกข้อมูลมาจาก database โดยทำการคัดเลือกเฉพาะข้อมูลที่ต้องการ ซึ่งจะนำไปใช้ประกอบกระบวนการวิเคราะห์ในขั้นถัดไป โดย Data Warehouse จะเหมาะกับองค์กรที่ผู้บริหารเน้นการใช้ข้อมูลในกาารตัดสินใจ ซึ่งจะไม่เหมาะกับองค์กรที่ผู้บริหารใช้ประสบการณ์ในการตัดสินใจ

ลักษณะของ Data Warehouse
·        Organization เป็นการนำข้อมูลเข้ามาจัดเก็บตามหมวดหมู่ โดยจัดข้อมูลตาม subject
·        Consistency เนื่องจากข้อมูลมีความไม่สม่ำเสมอกันในแต่ละข้อมูล จึงต้องทำให้มีความสม่ำเสมอก่อนที่จะทำการจัดเก็บ
·        Time variant มีช่วงเวลาที่ชัดเจน
·        Non-volatile data ข้อมูลที่ถูกใช้มากจากอดีต ซึ่งจะไม่มีการเปลี่ยนแปลง ดังนั้นจึงไม่มีการ update ข้อมูล แต่จะทำการเพิ่มข้อมูลใหม่เข้ามาแทน
·        Relational
·        Client/server

ไม่มีความคิดเห็น:

แสดงความคิดเห็น