เนื้อหาวันที่ : 2008-11-20 15:46:30 จำนวนผู้เข้าชมแล้ว : 2149 views

การบริหารจัดการความเสียหาย ด้วยศูนย์ข้อมูลองค์กรและความต่อเนื่องทางธุรกิจ

การดำเนินธุรกิจที่ไม่เคยหยุดนิ่งในโลกปัจจุบัน การเข้าถึงแอพพลิเคชั่น และข้อมูลได้อย่างรวดเร็ว และต่อเนื่องถือเป็นสิ่งสำคัญต่อความสำเร็จ ดังนั้น คำว่า ความต่อเนื่องทางธุรกิจ จึงกลายเป็นส่วนหนึ่งในพจนานุกรมทางด้านธุรกิจ และไอที รวมถึงเป็นสัดส่วนที่เพิ่มขึ้นของการลงทุนงบประมาณด้านไอที ภัยคุกคามและความเสียหายซ่อนตัวอยู่ในทุกมุมของโลก เห็นได้ชัดจากภัยพิบัติทางธรรมชาติในเอเชียที่เกิดขึ้นเมื่อเร็วๆ นี้

.

การดำเนินธุรกิจที่ไม่เคยหยุดนิ่งในโลกปัจจุบัน การเข้าถึงแอพพลิเคชั่น และข้อมูลได้อย่างรวดเร็ว และต่อเนื่องถือเป็นสิ่งสำคัญต่อความสำเร็จ ดังนั้น คำว่า ความต่อเนื่องทางธุรกิจ จึงกลายเป็นส่วนหนึ่งในพจนานุกรมทางด้านธุรกิจ และไอที รวมถึงเป็นสัดส่วนที่เพิ่มขึ้นของการลงทุนงบประมาณด้านไอที ภัยคุกคามและความเสียหายซ่อนตัวอยู่ในทุกมุมของโลก เห็นได้ชัดจากภัยพิบัติทางธรรมชาติในเอเชียที่เกิดขึ้นเมื่อเร็วๆ นี้

.

จากกรณีแผ่นดินไหวที่เสฉวนเมื่อเดือนพฤษภาคม ส่งผลให้มีผู้เสียชีวิตและเกิดความเสียหายด้านทรัพย์สิน และสินทรัพย์ทั้งในส่วนขององค์กร และของบุคคลในวงกว้าง เหตุการณ์นี้ทำให้จีนตกอยู่ในความภาวะเศร้าหมองและเสียใจอย่างล้นเหลือ นอกจากนี้ ยังก่อให้เกิดความหวาดหวั่นจนเกิดคำถามมากมายเกี่ยวกับความสามารถของศูนย์ข้อมูลองค์กรที่จะรับมือกับภัยพิบัติได้

.

ภัยพิบัติทางธรรมชาติทำให้ผู้เชี่ยวชาญด้านไอทีต้องกลับมานั่งพิจารณาต่อคำถามดังกล่าว เช่น จะสามารถจัดการระบบข้อมูลขององค์กรให้รับมือกับแผ่นดินไหวได้อย่างไร เมื่อเกิดภัยพิบัติ เราจะต้องเตรียมการอย่างไร รวมทั้งมีทางแก้ไขหรือไม่ คำถามที่เกิดขึ้นถือเป็นเรื่องดีที่จะเปิดโอกาสให้เกิดการตรวจสอบการคุกคามใหม่ที่ศูนย์ข้อมูลต้องเผชิญ และองค์กรจะสามารถเตรียมการเพื่อจัดการกับภัยพิบัติต่างๆ ได้อย่างไรบ้าง

.

 ฮิว โยชิดะ ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี (ซีทีโอ) บริษัท ฮิตาชิ ดาต้า ซิสเต็มส์

.

เหตุการณ์แผ่นดินไหวที่เสฉวนได้ก่อให้เกิดผลกระทบกับบริเวณที่เป็นศูนย์กลางของแผ่นดินไหวและพื้นที่จริงที่ได้รับผลกระทบจากกรณีดังกล่าว ซึ่งความเสียหายนั้นมีสูงกว่าที่คาดการณ์ไว้อย่างมาก เว้นแต่ว่าศูนย์ข้อมูลองค์กรที่ตั้งอยู่ในบริเวณศูนย์กลางของแผ่นดินไหวนั้นจะสามารถกู้คืนความเสียหายได้ หรือไม่ก็ต้องมีระบบสำรองข้อมูลที่จัดเก็บไว้ในฮาร์ดแวร์ที่แข็งแกร่งอย่างที่สุด

.

กรณีนี้แสดงเห็นได้ว่าศูนย์ข้อมูลองค์กรไม่สามารถทนต่อภัยพิบัติได้ใช่หรือไม่ คำตอบคือ ไม่ใช่ หนึ่งในวิธีแก้ไขที่องค์กรปัจจุบันสามารถดำเนินการได้ก็คือ การจำลองแบบข้อมูลระยะไกล (remote data replication) ซึ่งได้รับการพิจารณาว่าเป็นหนึ่งในระบบที่มีความปลอดภัยสูง และน่าเชื่อถือที่สุด จากเหตุการณ์แผ่นดินไหวในเสฉวนที่ส่งผลกระทบต่อพื้นที่กว่า 300 ตารางกิโลเมตรนั้น ระบบกู้คืนความเสียหายใดๆ ที่ตั้งอยู่ในพื้นที่ดังกล่าวอาจไม่แน่ใจว่าข้อมูลในศูนย์ข้อมูลองค์กรจะสามารถเก็บสำรองข้อมูลได้ปลอดภัย ดังนั้น การจำลองแบบข้อมูลไปเก็บไว้ยังไซต์ระยะไกลแห่งที่สองจึงเป็นยุทธศาสตร์ที่สำคัญต่อความต่อเนื่องทางธุรกิจที่ต้องเผชิญกับภัยพิบัติร้ายแรง

.

การจำลองแบบข้อมูลไปยังไซต์ระยะไกลแห่งที่สองเป็นนโยบายที่สามารถประกันได้ว่าระบบจะไม่หยุดทำงาน การจำลองแบบข้อมูลระยะไกลเอื้อให้เกิดการกู้คืนข้อมูลได้ในเวลาอันสั้น หลังจากที่ระบบล้มเหลวจะต้องแน่ใจได้ว่าข้อมูลที่เสียหายจะมีอยู่น้อยที่สุด ขณะเดียวกันขั้นตอนในการกู้คืนก็จะต้องไม่มากมายหลายชั้นเหมือนกับการคัดลอกดิสก์ในรูปแบบเดิม นอกจากนี้ จะต้องไม่กระทบต่อการดำเนินงานปกติด้วย

.

การจำลองแบบข้อมูลระยะไกลช่วยให้เกิดการวางแผนที่สั้นลง เช่น การป้องกันระบบ การทดสอบการปรับใช้และการพัฒนา รวมทั้งการสำรองข้อมูลโดยที่ไม่กระทบต่อการดำเนินงานปกติ โดยสิ่งนี้จะช่วยให้องค์กรสามารถผลิตข้อมูลได้อย่างต่อเนื่อง นอกจากนี้ การสำรองข้อมูลผ่านทางออนไลน์จะช่วยลดเวลาที่ใช้ไปอย่างมากกับการกู้คืนข้อมูลจากเทปบันทึก

.

สิ่งสำคัญคือเวลาที่ใช้ในการซ่อมแซมความผิดปกติและความเร็วของการกู้คืนข้อมูล ซึ่งจะต้องแน่ใจได้ว่าศูนย์กลางการสนับสนุนจะสามารถเข้าควบคุมระบบหลักได้ อีกทั้งกระบวนการคัดลอกระยะไกลนี้จะต้องใช้การสำรองข้อมูลแบบออนไลน์ที่มีความทันสมัยที่สุดเพื่อให้การทดสอบการกู้คืนความเสียหายสามารถทำได้บ่อยครั้งโดยไม่ต้องปิดการทำงานของระบบ

.

การจำลองแบบข้อมูลระยะไกลสามารถนำไปใช้ได้สองรูปแบบ ได้แก่ การจำลองแบบซิงโครนัส และอะซิงโครนัส โดยการจำลองแบบซิงโครนัสจะทำให้แน่ใจได้ว่าการคัดลอกข้อมูลระยะไกล ซึ่งเหมือนกับการคัดลอกในไซต์หลัก จะต้องดำเนินการในเวลาเดียวกันกับที่มีการปรับปรุงการคัดลอกข้อมูลในไซต์หลัก

.

ทั้งนี้ ในการจำลองแบบซิงโครนัส การดำเนินการอัปเดตของ I/O จะยังไม่ได้รับการพิจารณาว่าเสร็จสมบูรณ์จนกว่าจะมีการยืนยันจากไซต์หลักและไซต์ระยะไกล เมื่อมีการดำเนินงานที่ไม่เสร็จสมบูรณ์เกิดขึ้น ระบบก็จะย้อนกลับไปดำเนินการใหม่ยังตำแหน่งที่ตั้งทั้งสอง ซึ่งจะรับประกันได้ว่าการคัดลอกระยะไกลนั้นจะเป็นอิมเมจข้อมูลที่แท้จริงของไซต์หลักเสมอ

.

นั่นหมายความว่า ถ้าเกิดความล้มเหลว I/O ระยะไกล และภายในไซต์หลักของการจำลองแบบซิงโครนัสก็จะล้มเหลวเหมือนกัน และถ้าสำเร็จก็จะสำเร็จเช่นเดียวกัน เวลาการกู้คืนของการจำลองแบบซิงโครนัสจะเร็วอย่างมากทำให้การดำเนินธุรกิจสามารถกลับมาต่อเนื่องได้ทันทีหลังจากที่ไซต์หลักหยุดทำงาน

.

ตามหลักแล้ว Fibre Channel ซึ่งเป็นโปรโตคอลการส่งผ่านของระบบจัดเก็บข้อมูลหลักขององค์กร สามารถดำเนินการคัดลอกระยะไกลได้ถึง 200 กิโลเมตรจากไซต์หลัก อย่างไรก็ตาม เมื่อมีระยะทางเพิ่มขึ้นก็อาจมีผลต่อประสิทธิภาพการทำงานได้ ความล่าช้าในการปรับปรุงที่ดำเนินการกับไซต์ที่สองอาจมีผลต่อประสิทธิภาพได้

.

ซึ่งขึ้นอยู่กับความไวในการตอบสนองของแอพพลิเคชั่นและเทคโนโลยีการสื่อสารระหว่างทั้งสองไซต์ ประสิทธิภาพของการคัดลอกแบบซิงโครนัสจะเริ่มลดลงที่ระยะทาง 32 -160 กิโลเมตร ซึ่งระบบนี้อาจไม่เพียงพอที่จะรองรับกรณีที่เกิดความเสียหายเหมือนกับเหตุการณ์แผ่นดินไหวที่เสฉวนที่ส่งผลกระทบครอบคลุมพื้นที่ในวงกว้างได้

.

ข้อด้อยของการจำลองแบบซิงโครนัสคือเรื่องระยะทาง ในขณะที่การจำลองแบบอะซิงโครนัสให้กลไกสำหรับการทำมิเรอร์ข้อมูลได้ในระยะทางต่างๆ เนื่องจากมีการนำเครือข่ายไอพีเข้ามาเกี่ยวข้องกับกระบวนการดำเนินงาน เมื่อใช้การจำลองแบบอะซิงโครนัส การดำเนินการเขียนในไซต์หลักจะถูกยกเลิกการเชื่อมต่อจากการดำเนินการเขียนในไซต์ระยะไกล

.

หลังจากเขียนข้อมูลลงในระบบจัดเก็บข้อมูลหลักเรียบร้อยแล้ว แอพพลิเคชั่นจะยังคงดำเนินการ อย่างต่อเนื่องโดยไม่ต้องรอการยืนยันจากไซต์ระยะไกลว่า ดำเนินการเขียนเสร็จสิ้นหรือยัง ดังนั้น การจำลองแบบอะซิงโครนัสสามารถขยายระยะทางออกไปได้โดยที่ไม่มีผลต่อการทำงานของแอพพลิเคชั่นและรูปแบบนี้น่าจะเป็นทางออกที่ดีในการรับมือกับภัยพิบัติในลักษณะเดียวกับเหตุแผ่นดินไหวที่เสฉวนได้

.

การจำลองแบบอะซิงโครนัสจะทำให้แน่ใจได้ถึงความสมบูรณ์ของการส่งผ่านข้อมูลผ่านทางเครือข่ายไอพี ซึ่งจะปรับปรุงประสิทธิภาพในด้านความต่อเนื่องทางธุรกิจ ในระหว่างการจำลองแบบระยะไกลแบบอะซิงโครนัส การดำเนินการของศูนย์หลักและศูนย์ระยะไกลจะแยกออกจากกันและกัน เมื่อข้อมูลถูกเขียนในศูนย์หลัก ระบบจะดำเนินการต่อไปตามปกติโดยที่ศูนย์หลักไม่จำเป็นต้องรอการยืนยันว่าข้อมูลถูกจัดเก็บเรียบร้อยแล้วในศูนย์ระยะไกล นอกจากนี้ การป้องกันความปลอดภัยที่พบใน Hitachi Universal Replicator (HUR) ยังทำให้แน่ใจได้ถึงความสมบูรณ์ของข้อมูลที่จะมีอยู่ตลอดเวลา และนั่นจะทำให้การกู้คืนข้อมูลสามารถดำเนินการได้เร็วขึ้นสำหรับระบบระยะไกล

.

การจำลองแบบอะซิงโครนัสเป็นหนึ่งในโซลูชั่นที่มีประสิทธิภาพสูงสุดสำหรับความเสียหายที่เกิดจากมนุษย์หรือธรรมชาติ เช่น แผ่นดินไหว อัคคีภัย หรือสึนามิ เนื่องจากสามารถคัดลอกข้อมูลได้โดยไม่คำนึงถึงระยะทาง การส่งผ่านข้อมูลไม่ล่าช้า โดยภัยพิบัติอาจทำลายสินทรัพย์ทั้งหมดของบริษัทที่อยู่ในพื้นที่ที่ได้รับผลกระทบ แต่ข้อมูลจะยังคงอยู่ในไซต์ระยะไกลแห่งที่สองอย่างปลอดภัย สิ่งนี้ทำให้แน่ใจได้ถึงความปลอดภัยของศูนย์ข้อมูลบริษัทและในเวลาเดียวกันยังแน่ใจได้ถึงความต่อเนื่องของธุรกิจด้วย

.

การนำยุทธศาสตร์ความต่อเนื่องทางธุรกิจมาใช้มีข้อดีหลายประการ นอกจากจะลดเวลาที่หยุดทำงานของระบบให้เหลือน้อยที่สุดและได้รับผลตอบแทนการลงทุนที่ดีขึ้นแล้ว ยังทำให้การกู้คืนความเสียหายเป็นเรื่องง่ายและการเริ่มระบบการทำงานใหม่/การกู้คืนข้อมูลในระยะทางใดๆ แบบเสมือนจะสามารถเกิดขึ้นได้โดยที่กระทบต่อเวลาการตอบสนองแอพพลิเคชั่นน้อยที่สุด

.

แม้ว่าเหตุการณ์แผ่นดินไหวในเสฉวนจะเป็นโศกนาฎกรรมแห่งการสูญเสียครั้งใหญ่และไม่อาจลบเลือนหายไปได้อีกนานแสนนาน แต่แผนการกู้คืนความเสียหายจะช่วยปกป้องสินทรัพย์ข้อมูลให้คงอยู่ได้นานแสนนานได้