隨著大數據、元宇宙時代的到來,人類幾乎已經無法脫離IT科技進行工作。在這樣的背景下,數據中心已經成為了每個企業、組織的重要組成部分,數據中心這種重要的基礎設施,可以說是每個現代企業的重要驅動引擎。可靠的、高效的數據中心基礎設施,可以更好的為IT設備服務,從而提高員工的工作效率以及企業的生產力。擁有高性能的ICT資源,對於實現企業目標的業務流程至關重要。因此,由於對數據中心的要求越來越高,數據中心的設計也越來越重要。
數據中心癱瘓/宕機導致的後果(Downtime and its consequences)
- - 2016年,由於數據中心的電力中斷,達美航空不得不取消740個航班。斷電後,關鍵系統和網絡設備未能切換到備用系統,損失估計達1.5億美元;
- - 2013年,美國國家安全局猶他州數據中心受電湧影響,造成幾十萬美元的損失;
- - 2017年,由於UPS電源被意外關閉,英國航空公司的全球IT系統崩潰,導致的整個機隊停飛,數以千計的乘客在英國滯留了一個周末。
以上這些個例子,說明數據中心的癱瘓對所有者、經營者及其客戶造成了巨大的商業影響。特別是在人們越來越依賴信息技術的今天,不僅對商業而且對我們的日常生活的影響也在逐年增加。
數據中心的複雜性(Complexity of data centres)
建立一個可靠的數據中心需要許多基礎設施設備,從輸入的電源設備一直到網絡設備。所有這些元素都需要一起工作,以創造一個可靠的數據中心環境,因此需要對每個領域進行適當的關注和投資。這些領域及專業包括:供電系統、後備發電系統、配電系統、UPS電源系統、Raised Floor系統、佈線系統、冷氣系統、消防系統、通訊系統、IT系統、安保系統、樓宇自動化系統、照明系統等等。
數據中心的風險因素(Risk factors for data centres)
數據中心的好與壞有許多風險因素,這些因素來自於自然、人類或者網絡本身。我們需要必須認真檢查這些領域的風險,之後才可以確定採取哪些措施來減輕風險。
其中一些風險來自於自然,例如極端天氣、洪水、地震、雷電、空氣污染等等。對於部分自然因素,我們是可以通過前期設計來避免或降低這些危害帶來的損失。其他外部因素來自於人類本身。這些因素與人們在執行操作流程和錯誤地管理設備有關。
數據中心的價值
- The average cost of an unplanned data centre outage is $ 9000, while the maximum downtime costs $ 2,409,991(Ponemon Institute 2019)
- An in-depth 'business impact analysis' should be conducted to understand the true cost of business downtime
- Revenue/8760 (hour/year) may provide a quick estimate
- (Does not take seasonality and other factors into account)
數據中心癱瘓/宕機的主要原因(Main causes of downtime)
原因比例由多到少排序:
- 1) Hardware or System Failure > (1st Main cause)
- 2) Human Error > (2nd Main cause)
- 3) Software Program Malfunction >
- 4) Computer Virus >
- 5) Site Disaster
數據中心故障的主要因素(Predominant causes of data centre failures)
人為因素(Human error)
- - No or poorly executed processes and work instructions
- - Unauthorized access
- - Accidents
- - Unnoticed alarms
電力質量(Power quality issues)
- - Poor voltage/current/frequency regulation
- - High level of common and normal mode noise
- - High ground resistance
- - Harmonics
電磁場干擾(Electro-Magnetic Fields (EMF))
- - High radiation levels from power cables / UPS / transformers / PDU / lighting etc.
外部環境(Environmental conditions)
- - Temperature / humidity
- - Wrong cooling principles
- - High levels of contamination
- 高可用性
- 能適應快速發展的技術變化
- 準備好迎接未來的技術(如今大多數數據中心只是滿足現有的技術,而沒有為將來可實現的技術做好鋪墊)
- 考慮部署更多的電力及冷氣冗余能力供新設備
- 考慮未來15-20年發展
- 時刻管理和監測數據中心的狀態
- 不斷準備更新並考慮未來發展和擴容計畫
- 確保設備運行不會突然超出設計限制
沒有留言:
發佈留言
任何人若留有政治言論,個別使用者將會被隔離這個網誌,留言系統或將會被限制,甚至關閉