一、Sentinel 是什么 ? 
- Sentinel是分布式系统的流量防卫兵。
- Sentinel是阿里巴巴开源的,面向分布式服务架构的- 高可用流量控制组件。
随着微服务的流行,服务和服务之间的稳定性变得越来越重要。 Sentinel 是面向分布式服务架构的流量控制组件,主要以流量为切入点,从流量控制、熔断降级、系统自适应保护等多个维度来帮助您保障微服务的稳定性。
二、Sentinel 的历史 
- 2012 年,Sentinel 诞生,主要功能为入口流量控制。
- 2013-2017 年,Sentinel 在阿里巴巴集团内部迅速发展,成为基础技术模块,覆盖了所有的核心场景。Sentinel 也因此积累了大量的流量归整场景以及生产实践。
- 2018 年,Sentinel 开源,并持续演进。
- 2019 年,Sentinel 朝着多语言扩展的方向不断探索,推出 C++ 原生版本,同时针对 Service Mesh 场景也推出了 Envoy 集群流量控制支持,以解决 Service Mesh 架构下多语言限流的问题。
- 2020 年,推出 Sentinel Go 版本,继续朝着云原生方向演进。
三、Sentinel 的特征 
- 丰富的应用场景:Sentinel承接了阿里巴巴近10年的双十一大促流量的核心场景。 例如: 秒杀(即突发流量控制在系统容量可以承受的范围)、消息削峰填谷、实时熔断下游不可用应用等。 
- 完备的实时监控: Sentinel同时提供实时的监控功能。 您可以在控制台中看到接入应用的单台机器秒级数据,甚至500台以下规模的集群的汇总运行情况。 
- 广泛的开源生态: Sentinel提供开箱即用的与其它开源框架/库的整合模块, 例如: 与SpringCloud、Dubbo、 gRPC的整合。您只需要引入相应的依赖并进行简单的配置即可快速地接入Sentinel。 
- 完善的SPI扩展点: Sentinel提供简单易用、完善的SPI扩展点。您可以通过实现扩展点,快速的定制逻辑。 例如: 定制规则管理、适配数据源等。 
- 阿里云提供了企业级的Sentinel服务,应用高可用服务AHAS
四、Sentinel 基本概念 
1. 资源 
- 资源是 Sentinel 的- 关键概念。
- 它可以是 Java 应用程序中的任何内容。 例如,由应用程序提供的服务,或由应用程序调用的其它应用提供的服务,甚至可以是一段代码。 
- 只要通过 Sentinel API 定义的代码,就是资源,能够被 Sentinel 保护起来。 大部分情况下,可以使用方法签名,URL,甚至服务名称作为资源名来标示资源。 
2. 规则 
- 围绕资源的实时状态设定的规则,可以包括流量控制规则、熔断降级规则以及系统保护规则。
- 所有规则可以动态实时调整。
五、Sentinel 功能和设计理念 
- 流量控制在网络传输中是一个常用的概念,它用于调整网络包的发送数据。 然而,从系统稳定性角度考虑,在处理请求的速度上,也有非常多的讲究。任意时间到来的请求往往是随机不可控的,而系统的处理能力是有限的。我们需要根据系统的处理能力对流量进行控制。
- Sentinel 作为一个调配器,可以根据需要把随机的请求调整成合适的形状,如下图所示:
- 除了流量控制以外,降低调用链路中的不稳定资源也是 Sentinel 的使命之一。
- 由于调用关系的复杂性,如果调用链路中的某个资源出现了不稳定,最终会导致请求发生堆积。这个问题和 Hystrix 里面描述的问题是一样的。
- Sentinel 同时提供系统维度的自适应保护能力。
- 防止雪崩,是系统防护中重要的一环。当系统负载较高的时候,如果还持续让请求进入,可能会导致系统崩溃,无法响应。
- 在集群环境下,网络负载均衡会把本应这台机器承载的流量转发到其它的机器上去。如果这个时候其它的机器也处在一个边缘状态的时候,这个增加的流量就会导致这台机器也崩溃,最后导致整个集群不可用。
- 针对这个情况,Sentinel 提供了对应的保护机制,让系统的入口流量和系统的负载达到一个平衡,保证系统在能力范围之内处理最多的请求。
六、Sentinel 是如何工作的 
Sentinel 的主要工作机制如下:
- 对主流框架提供适配或者显示的 API,来定义需要保护的资源,并提供设施对资源进行实时统计和调用链路分析。
- 根据预设的规则,结合对资源的实时统计信息,对流量进行控制。同时,Sentinel 提供开放的接口,方便您定义及改变规则。
- Sentinel 提供实时的监控系统,方便您快速了解目前系统的状态。
七、Sentinel 和 Hystrix 对比 
| Sentinel | Hystrix | |
|---|---|---|
| 隔离策略 | 信号量隔离 | 线程池隔离/信号量隔离 | 
| 熔断降级策略 | 基于响应时间或失败比率 | 基于失败比率 | 
| 实时指标实现 | 滑动窗口 | 滑动窗口(基于 RxJava) | 
| 规则配置 | 支持多种数据源 | 支持多种数据源 | 
| 扩展性 | 多个扩展点 | 插件的形式 | 
| 基于注解的支持 | 支持 | 支持 | 
| 限流 | 基于 QPS,支持基于调用关系的限流 | 有限的支持 | 
| 流量整形 | 支持慢启动、匀速器模式 | 不支持 | 
| 系统负载保护 | 支持 | 不支持 | 
| 控制台 | 开箱即用,可配置规则、查看秒级监控、机器发现等 | 不完善 | 
| 常见框架的适配 | Servlet、Spring Cloud、Dubbo、gRPC 等 | Servlet、Spring Cloud Netflix | 
