韓玉強,勤智(北京)科技有限公司區域項目經理,擁有9年IT行業經歷,具備豐富的IT運維產品實施和項目管理經驗。
山東省青島港始建于1892年,是世界第七大港、我國第三大外貿口岸,現由青島大港港區、黃島油港區、前灣港區和董家口港區等四大港區組成。現有職工24000多人,擁有碼頭15座,泊位72個。
技術支撐平臺建設目標
信息化作為港口建設的有力支撐,青島港集團一直很重視信息化建設,先后建立了先進的光纖系統和無線網絡;創立了國內港口規模和技術都走在前沿的EDI中心、生產指揮中心和物流信息平臺;建成了生產管理、船舶資料、財務管理、資產管理、人力資源管理、設備管理、物資管理、工程管理八大主題數據庫;實現了港口業務與管理的數字化、網絡化、集成化,以持續的科技創新打造港口核心競爭力。
為保證信息系統的正常運維,必須建立以系統管理為核心的技術支撐平臺,形成一個“以技術手段和監控工具為支撐,以流程管理為手段,以IT服務管理為核心,以滿足業務需求為目標”的運維管理框架。
2015年,青島港集團通過公開招標,選中勤智OneCenter一體化智能運維管理系統,建立了青島港集團的IT綜合運維管理平臺。運維一期平臺建設,將青島港集團主干網絡的IT基礎設施和業務系統全面監控起來,通過網絡拓撲圖、設備性能視圖、機房視圖、設備告警視圖和業務系統視圖,直觀反映全網IT資產和業務系統的運行狀態,及時發現設備故障,變被動運維為主動運維。
需求分析
隨著虛擬化平臺大規模上線、機房的升級改造、大批量硬件服務器的購入和啟用,需要對機房動力環境進行重新建設和一體化監控;需要對虛擬化進行一體化監控,自動生成虛擬化拓撲,快速虛擬化故障定位;需要對服務器硬件進行集中監控。2017年,青島港集團從資源高效利用、提高工作效率、及時發現解決問題等角度出發,決定對勤智OneCenter統一監控運維平臺升級,進行運維二期平臺建設。
對現有監控系統進行版本升級和擴容,重新規劃部署架構,方便各分公司擴容;
依托監控平臺實現對青島港集團虛擬化平臺的一體化監控;
依托監控平臺實現對帶外服務器的硬件監控;
機房動力環境重新建設并納入一體化監控體系。
解決方案要點
通過現場需求調研,勤智決定采用分布式部署方式進行監控系統平滑升級,新監控系統增加機房動環監控模塊、虛擬化監控模塊和服務器硬件監控模塊。分布式的部署方式,解決了單機部署的擴容瓶頸,可以根據以后的擴容需求靈活擴充分采集器,分布式部署可實現對IT基礎架構的統一管理、統一發現、統一告警、統一處理、統一報表數據管理,實現人員的統一管理、統一登錄。此外,平滑的升級可保證監控資源和歷史數據的完整性,避免重復性的添加工作。
部署機房動力環境監測系統,并與監控系統集成,實現一體化監控。集成內容包括電力監控、空調監控、溫濕度監控等性能展示和告警統一展示。
添加服務器硬件監控模塊,實現對服務器硬件部件的監測。監測項包括:風扇轉速、機箱內部和CPU溫度、電源電壓、電源開關狀態、CMOS電池容量、CPU、磁盤、內存、RAID卡等硬件狀態等。
添加虛擬化監控模塊,對客戶的Vmware虛擬化系統進行一體化監控。自動發現VMWare虛擬化平臺集群、虛擬主機、虛擬存儲和虛擬機,自動生成虛擬化的拓撲架構,提供虛擬化資源的TOPN和報表統計。
預留分布式采集接口,方便后期分公司擴容。主服務器自帶統一門戶,可實現人員與資源權限的統一管理、統一登錄。
運維平臺價值
通過兩期的IT綜合運維管理平臺建設,青島港集團搭建起智能化、一體化的運維管理體系,建立了看得見、可預知、可計量的主動式運維管理模式,明顯提高運維服務的效率和質量。
建立起先進的運維管理體系。通過OneCenter一體化監控運維平臺建立統一集中的管理體系,統一的數據處理和展現,統一的告警平臺。統一的數據處理和展現,擺脫舊監控模式和事件的現狀,在新的監控平臺中集中實現,并通過統一的展現界面展現。統一的告警平臺,將所有告警納入監控管理監控平臺,并通過短信、郵件和桌面客戶端統一告警。
建立全集團的信息化管理員檔案,根據管理職責分配資源管理、拓撲查看、業務管理權限。
各個管理員可靈活自定義首頁展示模塊。
系統管理員可靈活設定系統Log、皮膚等系統信息。
建設起全面的IT基礎資源監控,消除監控死角。在集團內網建立一體化平臺,實現對主機、存儲、網絡、應用系統、數據庫、中間件、負載均衡、安全產品、動力環境等軟硬件設備運行狀態的實時監控,消除監控死角,及時發現安全隱患,并進行報警處理。
幫助客戶自動生成集團拓撲,通過拓撲分組建立起各分公司的子拓撲,直觀顯示網絡架構、設備的運行狀態和網絡鏈路的性能和通斷情況。
主干拓撲
分公司子拓撲
通過設備性能監控和告警閾值設定,直觀展示設備運行的健康狀態,產生告警后通過告警管理可快速故障分析。
實現機房動力環境的一體化監控管理:通過OneCenter的機房動力環境監測系統建設,對信息中心主機房內動力環境(如溫度、濕度、煙感、漏水、UPS、門禁、視頻等)進行集中監控;與監控系統進行一體化的集成,實現了功能展示和告警的統一管理。通過一體化監控,故障響應和處理更及時,大大提高了機房管理的效率和質量。
主頁集成
空調監控集
電力監控集成
門禁集成
全面的服務器監控。通過OneCenter的帶外服務器硬件監控模塊,實時掌握機房內的IBM、浪潮等服務器硬件運行狀態,如風扇轉速、機箱內部和CPU溫度、電源電壓、電源開關狀態、CMOS電池容量、CPU、磁盤、內存、RAID卡等運行狀態,結合操作系統監控,真正實現全方位的主機監控管理,有力保障了業務的正常運轉。
硬件監測主性能
服務器虛擬化的一體監控。勤智OneCenter的虛擬化監控模塊,通過與Vmware廠家深度API集成合作的方式,實現對服務器虛擬化一體化監控。它以拓撲圖的形式將虛擬主機、虛擬網絡、虛擬存儲等資源連接關系進行展現,逐層顯示虛擬資源的當前狀態和告警信息。此外,系統還提供豐富的TOPN、虛擬資源、性能、告警統計報表。一體化的虛擬化監控模式,方便運維人員全面了解當前虛擬化資源的性能和容量趨勢,準確對虛擬化系統的運行態勢做出正確判斷。
虛擬化拓撲
資源統計
構建實時、準確的資產配置管理庫:青島港項目在一期建設中通過勤智OneCenter的資產管理工具實現對信息中心IT資產進行基本信息和使用狀態步步追蹤,實現全生命全周期的資產配置管理,幫助資產管理員對所有資源臺賬一目了然,對資產的使用狀態準確記錄,可提高資產設備的重復使用率、及時淘汰報廢設備、更新所需設備,提高資產使用率,降低IT資產投入。
豐富、準確的運維報表統計:勤智OneCenter報表統計工具,采用獨立自主報表設計器,基于現有的采集、處理和運維數據,提供一系列性能、故障、排名、資產和運維統計報表。通過報表,青島港信息中心部門領導可隨時查看大量的運維數據,為日后的IT投資方向和運維改進決策提供參考數據。
關于“勤智運維”:作為ITSS副組長單位,“勤智運維”扎根行業、立足用戶、深入場景進行產品創新和研發,規范和引導信息技術服務標準體系建設,十多年來為教育、政府、金融、電力、互聯網、能源、通信、醫療、交通等20多個行業的1000多個企業用戶提供了優質的IT運維方案和服務。
OneCenter一體化智能運維服務管理平臺,以統一運維為基礎,以hadoop+spark大數據分析為核心,提供基礎監控、視頻監控、應用監控分析、云平臺管理、動環監控及可視化3D機房管理、第三方系統平臺集成等運維管理方案,是勤智結合國內外ITSS/ITIL/ISO20000等IT標準和最佳實踐,自主研發的一體化智能運維管理平臺。
杭州市濱江區偉業路3號
業務熱線(微信同號):18143453325
業務郵箱:2848414880@qq.com
業務QQ:2848414880
浙公網安備 33010802012068號