Data Virtualization
คำว่า Data Virtualization นี้ก็ถือว่าเป็นศัพท์เฉพาะที่ยังไม่เป็นที่แพร่หลายนัก เพราะบริษัท Composite Software ที่ถูกซื้อมาและถูกเปลี่ยนชื่อเป็น Cisco Information Server หรือ CIS เป็นผู้คิดค้นขึ้นมาและพัฒนาต่อเนื่องมาเป็นระยะเวลายาวนานกว่า 10 ปี
ถ้าอธิบายสั้นๆ ในเชิงธุรกิจ Data Virtualization คือเทคโนโลยีที่จะช่วยให้องค์กรสามารถนำข้อมูลทั้งหมดมาใช้งานแบบศูนย์กลางได้ หรือเรียกว่าการทำ Data Integration โดยไม่ต้องทำ Data Warehouse หรือ Big Data ในขณะที่ประสิทธิภาพการทำงานของระบบนี้ก็จะต้องมีความรวดเร็วสูง สามารถตอบโจทย์การวิเคราะห์ข้อมูลจากฐานข้อมูล หรือแหล่งข้อมูลที่หลากหลายได้จากศูนย์กลาง ทำให้องค์กรสามารถนำข้อมูลไปวิเคราะห์ได้อย่างรวดเร็ว ง่ายดาย และยืดหยุ่น โดยประหยัดค่าใช้จ่ายกว่าการทำ Data Warehouse หรือ Big Data นั่นเอง
ในมุมมองเชิงเทคนิค สิ่งที่ Data Virtualization ทำ ก็คือระบบ Query Engine ที่สามารถเข้าถึงข้อมูลจากทุกฐานข้อมูลและทุกแหล่งข้อมูลได้ และแปลงให้ข้อมูลที่กระจัดกระจายเหล่านั้นสามารถถูก Query ขึ้นมาใช้งานพร้อมๆ กันได้เสมือนถูกจัดเก็บอยู่ในฐานข้อมูลเดียว ทั้งในรูปแบบของ SQL, Web Services, Messaging หรือ Hadoop รวมถึงระบบฐานข้อมูลสำหรับระบบ ERP ชั้นนำอย่าง SAP เพื่อให้องค์กรต่างๆ สามารถพัฒนา Analytic Software หรือ Front-end Application สำหรับตอบโจทย์การวิเคราะห์ข้อมูลได้อย่างอิสระ และยังมีความรวดเร็วในระดับเดียวกับการ Query SQL Database ด้วย Query Optmization Algorithm หลากหลาย ผสมกับเทคนิคต่างๆ เช่น การทำ Caching เพื่อให้การเข้าถึงข้อมูลเหล่านั้นมีความเร็วสูงสุด และส่งผลกระทบต่อประสิทธิภาพของระบบ Production ทั้งหมดน้อยทีสุดไปพร้อมๆ กันด้วย
สำหรับองค์กรที่ยังมีข้อมูลจำนวนไม่มากนัก Data Virtualization อาจจะยังไม่จำเป็น แต่สำหรับองค์กรขนาดใหญ่ที่มีแผนจะทำระบบ Enterprise Data Analytics นั้น Data Virtualization ถือเป็นอีกหนึ่งเทคโนโลยีที่ควรศึกษาและพิจารณาควบคู่ไปกับการทำ Big Data เพื่อดูว่าระบบที่ต้องการนั้น เหมาะกับการใช้ Data Virtualization เป็นหลัก หรือเหมาะกับการใช้ Big Data เป็นหลัก หรือเหมาะกับการใช้ทั้งสองเทคโนโลยีควบคู่กันไป โดยสรุปแล้ว Data Virtualization จะมีประโยชน์ดังต่อไปนี้
- สามารถรวมฐานข้อมูลและแหล่งข้อมูลหลากหลาย ให้ Query จากศูนย์กลางด้วยวิธีการที่ต้องการได้อย่างง่ายดาย
- สามารถใช้งานข้อมูลจากหลายแหล่งได้แบบ Real-time โดยไม่ต้องเสียเวลาทำการ Migrate หรือ Transform ข้อมูล
- สามารถเข้าถึงข้อมูลจำนวนมากได้ด้วยความเร็วสูง
- รองรับการนำไปใช้งานได้หลากหลาย
- สามารถกำหนดสิทธิ์การเข้าถึงข้อมูลได้หลากหลายระดับสำหรับผู้ใช้งานแต่ละคนได้
- มีระบบ Self Service ทำให้ผู้ที่ต้องวิเคราะห์ข้อมูลสามารถทำงานร่วมกันได้อย่างรวดเร็ว
- รองรับการเพิ่มขยายระบบให้มีขนาดใหญ่ขึ้นได้ตามต้องการ
ขอบคุณแหล่งข้อมูลจาก
ไม่มีความคิดเห็น:
แสดงความคิดเห็น