วันพุธที่ 19 มกราคม พ.ศ. 2554

Data Management (Continued)


Major Benefits of Data Warehouses
1. ข้อมูลรวดเร็ว ทันต่อการใช้งาน
2. ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายขึ้น

- Single Sign-on การ log-in เข้าสู่ระบบโดยใช้รหัสเดียวกันทั้งองค์กร
- Data Warehouses จะดึงข้อมูลมาจาก Data Warehouses และก็บข้อมูลที่จำเป็นสำหรับผู้บริหาร เพื่อใช้ในการวิเคราะห์ข้อมูลที่ต้องการ พร้อมกันนั้นจะมีการนำเสนอในรูปแบบต่างๆ ซึ่งจะขึ้นอยู่กับตัวโปรแกรม Data Warehouse โดยนำเสนอเป็นไปในเชิงลักษณะของการใช้บริหาร เช่น Drill Downs
- Drill Downs จะให้ข้อมูลในภาพรวมก่อน แล้วให้ผู้สนใจในส่วนใดส่วนหนึ่งสามารถค้นคว้าลึกลงไปดูได้
- ระบบสารสนเทศ/ระบบการจัดการข้อมูล  มีระบบในารคัดกรองให้การเข้าถึงข้อมูลทำได้เฉพาะผู้ที่ที่เกี่ยวข้องกับข้อมูลจริงๆเท่านั้น

Data Warehouse Processing
         
กระบวนการจัดทำ Data Warehouse มีขั้นตอนทั้งหมด 5 ขั้นตอน ดังนี้
          1.
รวบรวมข้อมูล  - ทั้งจากภายในองค์กร (Operational Data) และ ภายนอกองค์กร (External Data)
          2.
จัดทำ Meta Data- นำข้อมูลที่รวบรวมมาสร้าง Meta Data หรือ ข้อมูลของข้อมูล ที่ซึ่งใช้อธิบายเกี่ยวกับ Data ที่อยู๋ใน Warehouse
          2.
ทำ Data Staging - นำข้อมูลที่รวบรวมมาไปทำ Data Staging ซึ่งเป็นการจัดระบบข้อมูลที่มี และสร้างเป็น Data Cube ซึ่งประกอบไปด้วยการทำ Extract, Clean, Transform และ Load
          3.
สร้าง Data Warehouse - เมื่อได้ Data Cube แล้วจึงทำ Data Warehouse โดยยึด Business Object เป็นหลัก
          4.
สร้าง Business View - เมื่อได้ Data Warehouse แล้ว การนำเสนอข้อมูลจะต้องอยู่ในรูปแบบที่ง่าย เพื่ออำนวยความสะดวกในการนำไปใช้ของผู้บริหาร ซึ่งจะอกมาในรูปแบบของ Dash Board

The Data Mart : is a small scaled-down version of a data warehouse:
เป็นการตัดแบ่งข้อมูลตามความต้องการของผู้ใช้ออกมาเป็นส่วนย่อยๆ ในกรณีที่ผู้ใช้มีหลากหลาย Data Mart แบ่งเป็น 2 ประเภท คือ
1. Replicated (dependent) data marts โดยองค์กรจะทำ Data Warehouse มาก่อน แล้วแต่ละส่วนงานก็มาแยกข้อมูลมาทำ mart เฉพาะส่วนของตนเอง
2.  Stand – alone data martsช้ในองค์กรซึ่งไม่พร้อมทำ Enterprise Data Warehouse จึงทำเฉพาะ marts ในส่วนงานของตัวเองที่พร้อมไปก่อน เมื่อแต่ละส่วนงานพร้อมแล้วค่อยเอามารวมเป็น Enterprise (ในทางปฏิบัติไม่ค่อยเกิดจริง)

Business Intelligence
Balance Scorecard (BSC)
                การวัดผลในมุมมองต่างๆต่างต้องสร้าง KPI Dashboard  ต้องมี KPI เสมอ ตัวอย่าง KPI เช่น Cost per Sale ,Sales per Download ,Revenue per Sale, Profit per Sale
Dashboard
แบ่งเป็น 3 ประเภท เป็นผลการดำเนินงานในมิติต่างๆ แสดงเป็น chart ได้แก่
1. Operational dashboards
2. Tactical dashboards
3. Strategic dashboards

Business Value of BI  คือการวัดมูลค่าการใช้ Business Intelligence ให้เกิดประโยชน์ต่อองค์กร
Online Analytical Processing (OLTP) เป็น software technology ที่ทำให้นักวิเคราะห์ ผู้บริหาร ผู้จัดการ สามารถมองลึกลงไปในข้อมูลและสามาถระบุปัญหาได้
Data Mining Characteristics
                ข้อมูลต้องมีมากพอ อาจเก็บอยู่ใน data warehouse หรือที่ใดก็ได้ มีคุณลักษณะ 5 ประการ
1. Clustering - นำเสนอข้อมูลที่มีความสัมพันธ์กันเอง
2. Classification -
นำเสนอข้อมูลตามสมมติฐานที่เราคิด โดยให้ทดสอบว่าสมมติฐานนั้นจริงหรือไม่ อย่างไร
3. Association -
นำเสนอผลสืบเนื่อง
4. Sequence discovery - consequence
ที่เกิดตามหลังมา
5. Prediction -
นำเสนอโดยการพยากรณ์สิ่งที่จะเกิดขึ้น

Text Mining
·         Structured Data มี Attribute ที่เก็บใน field เดียวกัน
·         Unstructured Data เช่น compaint ของลูกค้า
·         ข้อมูลจำพวก ID จัดเป็น Numeric เนื่องจากมีสภาพในการคำนวณ (Check Digit) แต่ถ้าไม่ได้ไว้เพื่อการคำนวณนั้นจะเรียกว่า Alphabatic

บุญชัย ฉัตรโชคเฉลิมพร
5202112891

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

Data Management

                ระบบ (System) ประกอบไปด้วย input, process, output เป็นองค์ประกอบหลัก และมี environment, boundary, control&feedback และ subsystem เป็นองค์ประกอบเสริม โดยการสร้างระบบนั้นจะต้องมีการวางแผนและระบุวัตถุประสงค์ที่ต้องการ รวมไปถึงรูปแบบลักษณะระบบที่เหมาะสมด้วย

ระบบสารสนเทศ (Information System)
ระบบสารสนเทศมีหน้าที่ในการรวบรวมข้อมูลและใช้งานตามวัตถุประสงค์ของผู้ใช้ โดยรูปแบบของ output ที่เป็นสารสนเทศนั้น ลักษณะและรูปแบบของ Output จะไม่แตกต่าง Input มากนัก ทำให้ไม่สามารถแยกแยะได้ชัดเจนว่า output ที่ออกมานั้นเป็น Data หรือ Information ลักษณะดังกล่าวแตกต่างไปจาก output ของระบบอื่นๆ โดยในระบบอื่นๆนั้น ลักษณะและรูปแบบของ output จะแตกต่างจาก input อย่างชัดเจน

          data และ information แตกต่างตรงที่ หากเป็น information ผู้รับจะพิจารณาเห็นรับประโยชน์จาก output นั้นหรือสามารถช่วยทำให้เกิดการเปลี่ยนแปลงในพฤติกรรมได้ แต่หาก output นั้นผู้รับพิจารณาไม่เห็นประโยชน์ output นั้นจะเป็นเพียง data


Data Management  การบริหารข้อมูลทำได้ยาก เพราะ
  • มีข้อมูลเพิ่มขึ้นจำนวนมากตลอดเวลา
  • ข้อมูลกระจัดกระจายอยู่ตามหน่วยงานต่างๆ 
  • ข้อมูลมีความซ้ำซ้อน แต่ละฝ่ายมีการสร้างและเก็บแยกออกจากกัน
  • ข้อมูลจากภายนอกที่ใช้ในการตัดสินใจเป็นข้อมูลที่เราไม่มีอำนาจเป็นเจ้าของ
  • มีเรื่องความปลอดภัยของข้อมูล คุณภาพ และ จริยธรรมที่เป็นประเด็นสำคัญ
  • การเลือกเครื่องมือเพื่อใช้ในการจัดการนั้นเป็นปัญหาใหญ่

โดย Data Management แบ่งเป็น 4 อย่างคือ
·        Data Profiling
·        Data quality management
·        Data integration
·        Data augmentation

Data life cycle process
แบ่งออกเป็น 4 ขั้นตอน ดังนี้
           1. Collecting Data เก็บข้อมูล โดยสามารถเก็บข้อมูลได้จาก 3 แหล่งคือ Internal Data, External Data และ Personal Data
           2. Data Warehouse เลือกข้อมูลที่ต้องการใช้มารวมกันที่ Data Warehouse โดยจะเลือกเฉพาะข้อมูลย่อยๆ ที่ต้องการใช้ ไม่เลือกมาทั้งกลุ่ม
           3. Selecting Data ผู้ใช้เข้ามาคัดลอกข้อมูลเพื่อนำไปใช้ในการวิเคราะห์
           4. Analyzing Data วิเคราะห์ข้อมูล โดยอาจใช้เครื่องมือช่วยในการวิเคราะห์ เช่น OLAP, EIS, DSS เป็นต้น หลังจากนั้นจึงนำข้อมูลที่ผ่านการวิเคราะห์ไปประยุกต์ใช้ เช่น การทำ SCM, CRM หรือการวางแผนกลยุทธ์ เป็นต้น

Data Processing
แบ่งออกเป็น 2 ด้านคือ
          Transactional
          Analytical

Data Warehouse
           การทำ Data Warehouse นั้นเป็นการเตรียมข้อมูล เพื่อนำไปใช้ในการวิเคราะห์และประมวลผลเพื่อการตัดสินใจอีก ซึ่งจะเหมาะกับองค์กรที่ผู้บริหารเน้นการใช้ข้อมูลในกาารตัดสินใจ จะไม่เหมาะกับองค์กรที่ผู้บริหารใช้ประสบการณ์ในการตัดสินใจ

ลักษณะของ Data Warehouse
·        organization มีการจดหมวดหมู่ของข้อมูลใหม่ โดยจัดตามสิ่งที่สนใจ (Subject) เป็นหลัก
·        consistency ข้อมูลมีความสม่ำเสมอเหมือนกัน อยู่ในรูปแบบเดียวกัน
·        time variant มีช่วงเวลาที่ชัดเจน
·        non-volatile ข้อมูลจะไม่มีการถูกอัพเดท แต่มีการเพิ่มข้อมูลแทน
·        relational ใช้ relational structure
·        client/server ใช้ server เพื่อให้ผู้ใช้สามารถเข้าถึงข้อมูลได้ง่าย
องค์กรที่เหมาะกับการใช้ Data Warehouse
·         เหมาะกับองค์กรที่มี data จำนวนมาก
·         เหมาะกับองค์กรที่มีการจัดเก็บข้อมูลเดียวกันหลายแบบ หลายformat
·         เหมาะกับองค์กรที่มีบริหารแบบ Information-based approach

บุญชัย ฉัตรโชคเฉลิมพร
5202112891