MSITBlog

1 minute reading time (287 words)

Uninterrupted Power Supply (UPS)

a

โรงงานที่ผมทำงานอยู่นั้น ไม่ได้อยู่ในนิคมอุตสาหกรรมใด ๆ ดังนั้นเรื่องไฟฟ้าดับหรือไฟกระชากนี่เกิดขึ้นบ่อยอยู่เหมือนกัน โดยเฉพาะอย่างยิ่งในฤดูฝน (อย่าลืมนะครับว่า ผมกำลังเล่าเรื่องสมัยแถว ๆ ปี 2002 – 2005 สมัยนี้ มันคงดีขึ้นแล้วกระมัง)

เมื่อทีมฮาร์ดแวร์จากสหรัฐมาสำรวจ เราก็ขอให้มี UPS ติดตั้งอยู่ด้วย พวกเขาก็มองหน้าเราด้วยความงุนงงว่า เราจะเอามาทำอะไร หรือ ทำไมต้องมี อะไรประเภทนั้น … 

พอเราอธิบายให้ฟังว่า ระบบไฟฟ้าที่จ่ายมาให้เราจากส่วนกลางนั้นดับไปเฉย ๆ ก็มี เขามองหน้าเราด้วยสายตาไม่ค่อยจะเชื่อสักเท่าใด … อธิบายยังไง ๆ (ดูจากสายตาของเขาแล้ว) เขาก็ไม่ค่อยเชื่อสักเท่าไหร่ ... คงเป็นเพราะบ้านเขาไม่เคยมีไฟฟ้าดับมั๊ง

ในที่สุดผมต้องพาเขาเดินมาดูสายไฟแรงสูงที่พาดผ่านเสาไฟฟ้าฝั่งตรงข้ามโรงงานซึ่งมีต้นไม้สูง ๆ อยู่ แล้วก็อธิบายว่า ฤดูฝนบ้านไอนั้น ฝนจะตกหนักและมีลมแรงมาก บางทีกิ่งไม้มันก็จะไหวโอนไปสัมผัสกับสายไฟสองเส้น จึงเสมือนเกิดการลัดวงจร สะพานไฟที่สถานีจ่ายไฟก็จะตัด เพื่อป้องกันเอาไว้ก่อน

แล้วก็ชี้ให้ดูว่า โรงงานเราดึงไฟจากสายไฟเส้นนี้เข้ามาใช้ในโรงงาน  มันก็เลยดับไปด้วย ... เขาก็พยักหน้าเหมือนเข้าใจ แต่ก็ถามอีกว่า แล้วทำไมไม่ตัดกิ่งไม้ ผมก็อธิบายว่า การไฟฟ้าเขาก็มาตัดนะ แต่บางกิ่งมันก็ยังมีโอกาสโอนเอนมาโดนได้เมื่อลดพัดแรง ๆ เขาก็ถามโน่นถามนี่ ... ผมก็ตอบเท่าที่ตอบได้

ในที่สุดเขาก็ OK เข้าใจแต่ขอหลักฐานสนับสนุนหน่อย เขาบอกผมตรง ๆ ว่า ถ้าเอาเรื่องนี้ไปคุยที่สหรัฐ คนฟังก็คงนึกไม่ออกและไม่เชื่อว่ามันมีไฟดับบ่อยจริง เพราะเขาไม่เคยมีประสบการณ์มาก่อน ผมบอกว่า มีเดี๋ยวเอาให้ ….

โรงงานโดยทั่วไป มักจะติดตั้ง ตัว Monitor สภาวะที่เกิดขึ้นกับแรงดันไฟฟ้าเอาไว้ ยามใดที่ไฟดับ ไฟตก ไฟเกิน หรือ ไฟกระชาก อะไรแบบนี้ เครื่องนี้มันจะเก็บบันทึกเอาไว้และสามารถพิมพ์ออกมาดูได้ด้วย ปี ๆ หนึ่ง เราก็จะพิมพ์ออกมา แล้วทำสำเนาเก็บเอาเข้าแฟ้มเอาไว้ ผมก็เอามาสรุปย้อนหลังให้เขาไป 2 – 3 ปี พร้อมถ่ายสำเนาข้อมูลตัวอย่างไปให้เขาดูเป็นหลักฐานด้วย

ตอนนั้น ผมมีความรู้สึกว่า อะไรวะ ขอ UPS สักตัวนึงนี่ ... แม๊ ... มันขอยากกว่าขอเซิร์ฟเวอร์เสียอีกนิ

ในที่สุดผมก็ได้เครื่อง UPS ระดับสุดยอดมาตัวหนึ่ง เขาบอกว่า น่าจะสามารถแบ็กอัพระบบ IT ในห้องได้ทั้งหมดประมาณ 30 นาที สูงสุดไม่เกิน 45 นาที สิ่งที่ผมเล่าต่อไปนี้ สมัยนั้นผมทำเองนะครับ ไม่เกี่ยวข้องกับตำรับตำราใด ๆ ทั้งสิ้น ถือเป็นเรื่องที่ผมเก็บมาเล่าให้ฟังก็แล้วกัน

ผมก็เอาตัวเลข 30 นาทีนี้มาคิดเอาแค่ 75% (ที่เหลือเก็บไว้เป็น Safety Factor) ดังนั้น 30 x .75 = 22.5 นาที แล้วก็ปัดลงเป็นตัวเลขกลม ๆ ประมาณ 20 นาที หมายความว่า หลังจากไฟดับและใช้ไฟจาก UPS ไปประมาณ 20 นาที ผมจะถือว่าไม่ค่อยปลอดภัยแล้ว

จากนั้นก็มากำหนดกระบวนการชัตดาวน์ระบบในห้องนี้ พูดง่าย ๆ ก็คือ ถ้า UPS ทำงานผ่านไป 20 นาทีแล้ว เราจะเริ่มกระบวนการชัตดาวน์ระบบไปเรื่อย ๆ จะไม่รอให้ระบบดึงไฟมาจาก UPS จนมันจ่ายไม่ไหว แล้วระบบจะล่มไปเองในที่สุด แบบนี้ถือว่า ไม่ปลอดภัยครับ

ผมนำเซิร์ฟเวอร์ (ซึ่งมีหลายตัว) มาจัดลำดับความสำคัญ จากต่ำ (สำคัญน้อย) ไปหาสูง (สำคัญมาก) เครื่องที่มีความสำคัญน้อยที่สุด เช่น เกี่ยวกับงานสำนักงานทั่วไป จะถูกชัตดาวน์ก่อน (ตามด้วยอุปกรณ์สนับสนุนที่เกี่ยวข้อง) จากนั้นก็ชัตดาวน์เครื่องที่สำคัญสูงขึ้นไปเรื่อย ๆ ทำไปทีละตัว ๆ ไล่ไปเรื่อย ๆ จนเหลือแค่เซิร์ฟเวอร์ที่เอาไว้ติดต่อกับลูกค้าและHead Office เท่านั้นที่จะชัตดาวน์หลังสุด

ช่วงตรงนี้ เราจะมีเวลาเหลืออยู่ประมาณ 30 – 20 = 10 นาที (ที่ผมเรียกว่า Safety Factor นั่นเอง เพราะเวลาเราชัตดาวน์คอมพิวเตอร์ มันต้องใช้เวลาอยู่ช่วงหนึ่ง จึงแล้วเสร็จ ... จริง ๆ แล้ว ถ้าเราทยอยชัตดาวน์ไปเรื่อย ๆ การกินไฟจาก UPS มันก็จะค่อย ๆ ลดลง ก็เหมือนเวลาที่เรามีจะยืดออกไปได้อีกถึง 15 – 20 นาที ... ถ้าคิดว่าทำไม่ทัน จะชัตดาวน์เป็นกลุ่ม ๆ ก็ได้ อันนี้แล้วแต่ความเหมาะสม) … เซิร์ฟเวอร์ตัวสุดท้ายของผมจะชัตดาวน์เมื่อเห็นว่าพลังงานใน UPS เหลือต่ำกว่า 20% แล้ว  

ในทางกลับกัน เราก็จะกำหนดกระบวนการเริ่ม Start ระบบเอาไว้ด้วย เช่น พอไฟมา เราจะรอให้ผ่านไปสัก 5 นาทีก่อน เพราะช่วงนี้ไฟอาจจะยังไม่นิ่ง และเป็นการรอให้ฝ่ายผลิตเดินเครื่องจักรต่าง ๆ ให้เรียบร้อยเสียก่อน (ช่วงเริ่มเดินเครื่องจักร มันจะมีไฟกระชากเกิดขึ้นมาก) นอกจากนั้นยังช่วยให้ UPS ชาร์จขึ้นกลับขึ้นมาให้ได้ 25% เสียก่อน เผื่อว่าในขณะที่เรากำลัง Start เซิร์ฟเวอร์แล้วไฟดับไปอีก จะได้พอมีไฟจาก UPS ช่วยให้เราชัตดาวน์ได้อีกครั้งหนึ่ง

เราต้องกำหนดด้วยว่า เซิร์ฟเวอร์ตัวใดต้องขึ้นก่อน ตัวใดต้องขึ้นตามมา เป็นลำดับไป โดยเซิร์ฟเวอร์แต่ละตัวเมื่อขึ้นมาแล้ว ต้องตรวจสอบด้วยว่ามันทำงานถูกต้องแล้ว จึงเปิดใช้อุปกรณ์ต่าง ๆ ที่เชื่อมต่ออยู่กับตัวมัน

ถ้าเราไม่กำหนดขั้นตอนเหล่านี้เอาไว้ เมื่อจำเป็นต้องชัตดาวน์ระบบ หรือ สตาร์ตระบบขึ้นมา มันจะมั่วกันไปหมด ใครยังไม่ได้เตรียมก็คิดเอาไว้แต่เนิ่น ๆ นะครับ ...    

Verify Processes, Validate Results
Installation

Related Posts

 

Comments

No comments made yet. Be the first to submit a comment
Already Registered? Login Here
Guest
Monday, 10 December 2018