最近小嘉在逛知乎時看到一位知友提出了這樣的一個問題,這與之前溝通的一位客戶疑惑一致,為他解答的過程自己也整理除了一些思考,故和大家一起聊聊。
01. 開源工具為何會不符合公司要求?基于開源組件定制開發是否是好的方式?
開源工具早期包括現在一直都是國內國外企業在做運維時首選的工具體系,并且其中不乏很多工具入門簡單,上手極快,功能強大,安裝部署容易,并且還有開源免費的優勢,滿足了企業組織對維護數據中心穩定運行保障的要求。這里的開源軟件包括監控、日志、自動化等常見的運維場景。
1)單個開源工具無法滿足所有運維需求
單看其中一個開源工具,除了有上述提到的優勢之外,其實也必然存在他的技術短板。就拿監控舉例,Zabbix監控發現功能非常好用,并且插件擴展的方式幾乎可以豐富任何場景。但zabbix仍有它的短板。對于當前比較火的容器部署架構,Zabbix的IaaS層監控的優勢無法發揮出來,并且Zabbix 由于使用了關系型數據存儲時序數據,在監控大規模集群時存儲會遇到瓶頸。所以在容器、k8s架構下,Prometheus成為了更有優勢的工具。所以,為了滿足我們的運維需求,需要上很多運維工具。
2)運維核心轉向為整個應用與架構的健康性
我們在使用開源工具時,也會面臨很多場景問題無法滿足,現在的運維團隊不再是看單點的運行狀態,而是更多以業務視角看整個應用和架構的健康性,這時zabbix的告警無法根據業務拓撲進行收斂就會成為很大的問題,瘋狂的告警郵件甚至給運維增加了很多工作量。并且,zabbix根據不同場景的深度使用,都需要通過定制開發實現。除此之外,不同行業的運維體系都有報表和監控大屏的需要,這些也都需要基于業務特點,公司要求進行定開。而每種開源工具的代碼邏輯都不同,如果我們對所有使用到的工具都進行定制開發,耗費的人力物力可想而知。
3)開源工具聯動&集成難
開源工具搭建運維體系就會存在另外一個問題,這些工具之間的聯動,也需要通過點對點的對接的方式建設。那么新上一個開源工具,就需要跟前面的n個開源工具做集成,這種集成所需的交付周期也會比較長,而且聯動效果對接口強依賴,開的接口數量也不小。
從上面的分析就可以回答這三個問題:
02. 我們需要的運維平臺是什么樣的?如何建設呢?
換而言之,當遇到以上運維場景問題時,我們需要搭建一套自己的運維平臺。那么我們的運維平臺又要怎么建設呢?怎么才能把開源工具不滿足的短板補齊,滿足公司管理要求、又能滿足公司業務特點?
整個平臺如何搭建,可以參考OASR模型,結合運維流程,將IT運維對象 (Object)、運維活動(Activity)、運維場景(Scene)、運維角色(Role)進行分層剖析。
通過模型梳理清楚我們不同運維角色在運維場景中的需求,拆解每個運維場景涉及的運維活動和對應的執行對象,底層的不同技術棧對象如何納管,運維活動如何在一個平臺上實現,以及這種平臺建設后萬一有新的技術棧,會不會也遇到開源工具遇到的問題?這些都要考慮。
在業內,就有實現運維平臺建設的案例,騰訊內部根據這種運維場景和運維活動的梳理,內部搭建了一套藍鯨運維平臺。目前,藍鯨運維平臺已經在金融、證券、航司、交通、政務等行業落地,在自動化、部署、監控、權限管理、日志等等各個方面有一套完整的解決方案。而為了避免開源工具使用中的問題,我們是這樣做的:
第一點,這個運維平臺為了能夠覆蓋多種技術棧,在平臺層通過一個Agent納管底層所有的運維對象節點,以及無法下發Agent的網絡設備等,可以通過協議管理的方式實現,首先做到了平臺對底層資源的管控一體。
第二點,區分運維活動和運維場景,運維平臺的能力層(PaaS)能夠滿足所有拆解后的運維單一動作,比如配置平臺管理、腳本作業、容器管理等。而上層運維場景已經沉淀了常用的場景,也可以基于底層能力的調用根據平臺的前后端開發框架,工具流水線、運行環境托管持續構建,能夠完全滿足不同運維角色的運維場景需求。這種底層的PaaS能力做到了平臺一體。
第三點,針對開源工具和商用工具無法天然聯動的問題,在平臺之上常用的應用配置門戶、監控告警、IT運維服務管理、應用發布自動化、災備切換自動化等工具已經實現了天然的聯動交互。并且外圍工具也可以基于藍鯨平臺提供的標準接口做集成對接,快速實現外圍工具與運維平臺的聯動一體。
目前,藍鯨平臺社區體驗版本,歡迎各位喜歡做運維開發技術研究的業內大佬體驗環境和做更多的技術交流。
碼字不易,若覺得有用,可點贊關注我們,會持續提供研發&運維相關的干貨內容。
若想深入了解咱們的運維平臺,歡迎去官網聯系嘉為藍鯨,我們將為您提供最新的產品材料與產品試用
嘉為藍鯨CPack制品管理平臺:聯邦倉庫——助力跨團隊、跨地域、跨組織的制品資產協作
查看詳細
嘉為藍鯨CMeas研發效能洞察平臺:一鍵保存你的專屬查詢儀表板
查看詳細
嘉為藍鯨WeOps數據庫監控新范式:以專業監控視圖,賦能高效運維管理
查看詳細
Jira國產化替代:從合規到價值,嘉為藍鯨DevOps敏捷協同平臺的破局之道
查看詳細
嘉為藍鯨CCI持續集成平臺:掌控CI/CD全流程,流水線Stage準入讓部署更可靠
查看詳細
嘉為藍鯨CMeas研發效能洞察平臺:研發效能周報,自動推送領導郵箱
查看詳細
申請演示