蓝鲸智云的幕后英雄:管控平台

本文目录

1、蓝鲸简介

2、IT基础架构运维的重点-服务器运维

3、蓝鲸管控平台:实力非凡的幕后英雄

4、蓝鲸管控平台的整体架构

5、蓝鲸管控平台支持proxy模式

6、蓝鲸管控平台的功能特性

7、蓝鲸管控平台的使用场景

8、蓝鲸管控平台的整体特性

一、蓝鲸简介

蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的企业研发运营一体化技术解决方案,提供了一个完整的研发、运维、运营的PaaS技术平台。

平台提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统。

蓝鲸智云是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。

对于蓝鲸不太了解和熟悉的同学可以移步这里:

还有这里:

请相信,你打开的不是两个链接,而是运维的新世界和新天地。

二、IT基础架构运维的重点-服务器运维

服务器(包括物理机和虚拟机)可能是企业IT运维管理中最常见、数量最多的一类管理对象。在中大型企业的IT环境中,服务器这类对象往往具有以下特点:

总结一下就是:

服务器作为承载各种类型的数据库、中间件、应用程序和其他组件的载体,注定会成为IT运维管理的重要对象,并且可能也是运维操作数量和频率上最大的对象。

针对上述服务器运维的特点和现状,我们很容易想到通过自动化运维平台和工具去实现服务器大批量、自动化运维管理。有天赋的小伙伴可能进一步联想到了蓝鲸平台的能力,比如作业平台、标准运维等,去实现服务器的自动化运维管理。

很棒!但是在利用蓝鲸平台的上述SaaS工具去实现服务器的自动化管理之前,首先需要将所有的服务器对象进行统一纳管,那么这个事情谁来做呢?它就是蓝鲸的管控平台。

只有将服务器统一纳管,并且将运维驱动服务器的能力通过API接口方式释放给上述SaaS工具之后,作业平台也好,标准运维也好才能有用武之地。

三、 管控平台:实力非凡的幕后英雄

如果把蓝鲸的管控平台理解为就是服务器上安装的一个Agent以及后端的一个Server,那就 too young too simple了。

蓝鲸管控平台,是整个蓝鲸平台的底层管控系统,是蓝鲸所有其他服务的基础,是蓝鲸服务体系与用户机器的连接器。

蓝鲸管控平台是典型的两层分布式 C/S 结构,主要包含智能 Agent,提供各种服务的 Server,以及 Zookeeper、Redis、MySQL 等周边保障模块。其中Agent 是部署在业务机器上的程序,每台业务机器理论上只可以部署一个;其他模块部署无具体要求,用户可以单独部署,也可以混合部署。

在整个蓝鲸体系中,唯独蓝鲸管控平台没有直面用户,但蓝鲸管控平台在蓝鲸体系中却是不可或缺的,它为蓝鲸其他平台提供了人机交互的管道与能力。蓝鲸管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。

事实上蓝鲸在设计管控平台的时候,再次用到了“服务能力抽象和原子化”的设计思路。我们在之前文章《看蓝鲸标准运维如何编排一切》中介绍“标准运维”这个产品如何诞生的时候提到这种思路:将复杂的运维流程分解,抽象成运维原子,通过原子的组装和编排实现各式各样复杂的运维场景和流程。

管控平台的设计也是如此。你如果仔细观察上述罗列的所有服务器层面的操作管理,并认真思索他们的相同点的话,你会发现所有这些操作最终在操作系统层面的实现,都是用到这三种能力中的一种或者几种:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。

在蓝鲸的管控平台中,在服务器客户端的Agent层面提供了面向操作系统的与这三种能力对应的三种管道:文件分发传输的管道、命令实时执行与反馈的管道、大数据采集与传输的管道;在后台服务器端相应的提供了三种类型的Server:TaskServer(命令)、FileServer(文件)、DataServer(数据),来执行相应的能力并提供对应的服务。

这与我们之前见过的很多其他类型软件的Agent是有巨大差别的。在蓝鲸的Agent上面并不集成具体的功能,Agent仅仅提供三种管道能力。功能或者场景的定义是在蓝鲸平台的SaaS层进行定义的。

如下图所示:黄色方框是蓝鲸Agent提供的三种管道能力,这三种能力是由管控平台直接接管的;具体的运维场景和功能,我们在SaaS工具层定义,比如我们提前介绍的操作系统批量巡检、补丁管理、安全基线管理、软件安装与卸载、帐户与权限管理、日志管理等等,它们通过调用不同的管道能力组合去实现自己的功能,如下图红色方框内容所示。

图片[1]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

这样做的好处是什么呢?通过如此安排,事实上我们将SaaS的功能、场景与Agent之间进行了解耦,当运维工作中出现新的操作系统层面的运维场景时,需要开发新的SaaS工具来实现的时候,通过ESB(企业运维服务总线)直接调用管控平台和Agent的管道和能力即可,而不需要对管控平台或者Agent进行任务的改造或者变更。是不是既巧妙又强大呢?

四、蓝鲸管控平台的整体架构

我们将上述针对蓝鲸管控平台的描述具象化和可视化之后,就能够得到下面这张图:

图片[2]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

其中:

五、蓝鲸管控平台支持Proxy模式

蓝鲸管控平台同时也支持Proxy模式,当我们需要管控私有云或者公有云中隔离的网络区域的服务器时,可以通过一级或者多级proxy级联的方式进行纳管和统一的驱动。这样使得蓝鲸管控平台海量、跨云、全球节点管控的能力。

Proxy模式架构图如下图所示:

图片[3]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

六、蓝鲸管控平台的功能特性 1、文件分发与传输

文件分发是指用户从指定机器将指定文件批量传输到特定范围的机器上。文件分发是用户的一种行为,传输则是针对用户行为的程序行为。

下面将简要描述文件分发传输的主要功能点:

传输模式:

传输类型:

传输控制:

2、实时任务执行

任务类型:

任务控制:

3、数据采集与传输

数据采集服务:

4、集群管理

集群管理

5、支持的OS

图片[4]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

6、社区版、企业版、公有云版的差异

图片[5]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

七、蓝鲸管控平台的使用场景

在蓝鲸的非常多的SaaS工具中都需要管控平台所提供的底层能力,这里我们简单举例一些场景和例子:

作业平台:

作业平台是面向脚本执行、文件传输和SQL执行的统一作业中心。作业平台中的作业任务主要是调用管控平台的命令执行和文件传输两种服务,从而实现作业任务的执行。

图片[6]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

配置平台:

在蓝鲸智云体系里,配置平台扮演着基石的角色,为应用提供了各种运维场景的配置数据服务。在配置平台中,主要使用的是管控平台的数据采集能力,包括CI属性、服务器性能状态快照等的采集。

图片[7]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

蓝鲸监控:

蓝鲸监控也对服务器进行统一监控的过程中,也需要依赖管控平台的采集能力,来实时采集服务器的各项性能指标。

图片[8]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

场景和例子还有非常非常多,例如标准运维的流程编排、大数据平台的数据接入和采集、日志检索和查询等等,包括我们在蓝鲸平台上自定义开发的SaaS也需要去调用管控平台的能力。

八、蓝鲸管控平台的整体特性

接下来我们通过几个关键语句来总结下蓝鲸管控平台的整体特性和优势:

最新的蓝鲸社区版4.1.14已经正式发布,还在等待什么呢?赶紧下载,一起体验蓝鲸管控平台的强大能力。

图片[9]-蓝鲸智云的幕后英雄:管控平台-JieYingAI捷鹰AI

本文部分产品介绍来自官方白皮书:

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享