教據(jù)中心建設作為一種戰(zhàn)略投入基本上已經(jīng)形成共識,但是在巨額的投入后仍面臨著種種問題與風險,面臨著數(shù)據(jù)量急速膨脹,場地---不足,運營成本高昂、能耗大、安壘性差,業(yè)務連續(xù)能力低等一系列挑戰(zhàn)。
那么在數(shù)據(jù)中心運維管理工作中到底存在哪些問題呢?
1運維人員不了解數(shù)據(jù)中心運維管理系統(tǒng)規(guī)劃情況主要工作局現(xiàn)在對設備的維護上;
2簡單的依照標準確定運維內容,包括一些不重要、無關緊要和不對的指標;
3機房環(huán)境指標指示不正常溫度、濕度、正壓等,不知道如何改變制冷設備設置,使系統(tǒng)運行達到---狀態(tài);
4供電系統(tǒng)異常接地、零地電壓、干擾、it設備異常時,只知道在供電設備上查找原因,而---*終不能解決問題;
5管理界限不清楚,只維護部分基礎設施設備,忽略或不維護發(fā)電機和空調室外機等;
6只維護關鍵設備,對發(fā)電機、電池、配電、線纜長時間不做維護;
7設施文檔不*或不正確;
8發(fā)生事故時簡單地歸結為設備問題,不愿也無法找出引發(fā)事故的*原因,以至于故障*后再發(fā)生故障,或誘發(fā)其他環(huán)節(jié)故障。
9對設備和系統(tǒng)的智能監(jiān)控管理功能不熟悉,已有的智能管理功能不能得到充分的利用。
10無專門維護人員配制,或維護人員不符合標準;
11管理制度不健全,缺乏維護操作流程,無嚴格的交---制度。
(1)收集數(shù)據(jù)庫的性能統(tǒng)計數(shù)據(jù),檢查高速緩存區(qū)命中率、資源爭用等統(tǒng)計信息,若不理想,設法加以分析---。
(2)檢查數(shù)據(jù)對象存儲空間碎片情況,---時加以調整。
(3)比較分析數(shù)據(jù)庫系統(tǒng)和操作系統(tǒng)的cpu,內存,網(wǎng)絡,與硬盤的利用率,以此確定出近期將可能出現(xiàn)的資源爭奪趨勢,---時加以調整,以避免系統(tǒng)資源的爭奪,如果調整還達不到要求,須考慮增加新資源。
(4)檢查每日數(shù)據(jù)庫管理工作的執(zhí)行情況,用戶、數(shù)據(jù)對象存儲空間增加刪改的記錄是否齊全,備份記錄、維護記錄是否齊全,不足的與時補上。
數(shù)據(jù)中心基礎設施建設分為機房物理基礎設施和機房服務。
機房物理基礎設施
消防系統(tǒng):火災探測系統(tǒng),煙感探測系統(tǒng),滅火系統(tǒng)。
集成管理:門禁,動環(huán)監(jiān)控,集成管理。
綜合布線:走線架,光纖配線架,線纜 & 光纖,標識,走線支架。
制冷系統(tǒng):精密空調,舒適性空調,通風系統(tǒng)。
供電系統(tǒng):油機 & ats,ups,直流電源柜,交流電源柜,靜態(tài)轉換開關,電池及電池架,電源線纜。
內部裝修:平面布局,門 & 窗,墻 & ---,架空地板,照明等。
機柜系統(tǒng): 準確送風機柜,it設備機柜。
防雷/接地:瞬間浪涌電壓抑制裝置,接地保護系統(tǒng)。