Envoy 中的 xDS REST 和 gRPC 协议详解


通过示例详解 Envoy 的 xDS REST 和 gRPC 协议

Envoy 中的 xDS REST 和 gRPC 协议详解

通过示例详解 Envoy 的 xDS REST 和 gRPC 协议

Wed Oct 10, 2018

4800 Words|Read in about 10 Min|本文总阅读量
Tags: envoy   service mesh  

转载自:Envoy 中的 xDS REST 和 gRPC 协议详解
原文地址:https://github.com/envoyproxy/data-plane-api/blob/master/XDS_PROTOCOL.md
作者:狄卫华
修订:杨传胜

Envoy 通过查询文件或管理服务器来动态发现资源。这些发现服务及其相应的 API 被统称为 xDS。Envoy 通过订阅(subscription)方式来获取资源,如监控指定路径下的文件、启动 gRPC 流(streaming)或轮询 REST-JSON URL。后两种方式会发送 DiscoveryRequest 请求消息,发现的对应资源则包含在响应消息 DiscoveryResponse 中。下面,我们将具体讨论每种订阅类型。

1. 文件订阅


发现动态资源的最简单方式就是将其保存于文件,并将路径配置在 ConfigSource 中的 path 参数中。Envoy 使用 inotify(Mac OS X 上为 kqueue)来监控文件的变化,在文件被更新时,Envoy 读取保存的 DiscoveryResponse 数据进行解析,数据格式可以为二进制 protobuf、JSON、YAML 和协议文本等。

译者注:core.ConfigSource 配置格式如下:

{
  "path": "...",
  "api_config_source": "{...}",
  "ads": "{...}"
}

文件订阅方式可提供统计数据和日志信息,但是缺少 ACK/NACK 更新的机制。如果更新的配置被拒绝,xDS API 则继续使用最后一个有效配置。

Note


  • ACK 在 TCP 连接中是数据包确认消息,在 TCP 连接中,数据接收端在接收到一个数据包的时候会立即发送一个 ACK 消息给发送端,通知已经接收到此数据包,然后发送端再继续发送下一个数据包。
  • NACK 与 ACK 刚好相反,在 UDP 通信中,数据接收端接收到数据包后是不需要通知发送端的,发送端始终不断的发送数据包而不关心对方是否正确收到,亦不关心所发生的数据包是否有序到达。只有在接收端意识到有某个或某几个数据包没有接收到的情况下才会构造一个 NACK 消息包发送给发送端。请求发送端重发丢失包。
  • 比如接收端收到数据包 100, 101, 103,105,然后发现 102, 104 丢了,会构造一个 NACK 包发送给发送端。

    2. gRPC 流式订阅


    单例资源类型发现

    每个 xDS API 可以单独配置 ApiConfigSource,指向对应的上游管理服务器的集群地址。每个 xDS 资源类型会启动一个独立的双向 gRPC 流(每个 xDS 资源类型对应的管理服务器可能不同)。API 交付方式采用最终一致性。可以参考后续聚合服务发现(ADS) 章节来了解必要的显式控制序列。

    译者注:core.ApiConfigSource 配置格式如下:

    {
      "api_type": "...",
      "cluster_names": [],
      "grpc_services": [],
      "refresh_delay": "{...}",
      "request_timeout": "{...}"
    }
    

    类型 URL

    每个 xDS API 都与给定的资源类型一一对应。关系如下:

    • LDSenvoy.api.v2.Listener
    • RDS : envoy.api.v2.RouteConfiguration
    • CDS : envoy.api.v2.Cluster
    • EDSenvoy.api.v2.ClusterLoadAssignment
    • SDSenvoy.api.v2.Auth.Secret

    类型 URL 的概念如下所示,其采用 type.googleapis.com/<resource type> 的形式,例如 CDS 对应于 type.googleapis.com/envoy.api.v2.Cluster。在 Envoy 发起的发现请求和管理服务器返回的发现响应中,都包括了资源类型 URL。

    ACK/NACK 和版本

    每个 Envoy 流以发送一个 DiscoveryRequest 开始,包括了列表订阅的资源、订阅资源对应的类型 URL、节点标识符和空的 version_info。EDS 请求示例如下:

    version_info:
    node: { id: envoy }
    resource_names:
    - foo
    - bar
    type_url: type.googleapis.com/envoy.api.v2.ClusterLoadAssignment
    response_nonce:
    

    管理服务器可立刻或等待资源就绪时发送 DiscoveryResponse 作为响应,示例如下:

    version_info: X
    resources:
    - foo ClusterLoadAssignment proto encoding
    - bar ClusterLoadAssignment proto encoding
    type_url: type.googleapis.com/envoy.api.v2.ClusterLoadAssignment
    nonce: A
    

    Envoy 在处理 DiscoveryResponse 响应后,将通过流发送一个新的请求,请求包含应用成功的最后一个版本号和管理服务器提供的 nonce。如果本次更新已成功应用,则 version_info的值设置为 X,如下序列图所示:

    ack 更新

    在此序列图及后续章节中,将统一使用以下缩写格式:

    • DiscoveryRequest :(V=version_info,R=resource_names,N=response_nonce,T=type_url)
    • DiscoveryResponse : (V=version_info,R=resources,N=nonce,T=type_url)

    Note


    信息安全中,Nonce 是一个在加密通信只能使用一次的数字。在认证协议中,它往往是一个随机伪随机数,以避免重放攻击。Nonce 也用于流密码以确保安全。如果需要使用相同的密钥加密一个以上的消息,就需要 Nonce 来确保不同的消息与该密钥加密的密钥流不同。(引用自维基百科)在本文中 nonce 是每次更新的数据包的唯一标识。

    有了版本(version_info)这个概念,就可以为 Envoy 和管理服务器共享当前应用配置,以及提供了通过 ACK/NACK 来进行配置更新的机制。如果 Envoy 拒绝了配置更新 X,则回复 error_detail 及前一个版本号,在本例中为空的初始版本号,error_detail 包含了有关错误的更加详细的信息:

    nack 更新

    重新发送 DiscoveryRequest 后,API 更新可能会在新版本 Y 上成功应用:

    每个流都有自己的版本概念,但不同的资源类型不能共享资源版本。在不使用 ADS 的情况下,每个资源类型可能具有不同的版本,因为 Envoy API 允许不同的 EDS/RDS 资源配置指向不同的 ConfigSources

    何时发送更新

    管理服务器应该只向 Envoy 客户端发送上次 DiscoveryResponse 后更新过的资源。Envoy 则会根据接受或拒绝 DiscoveryResponse 的情况,立即回复包含 ACK/NACK 的 DiscoveryRequest 请求。如果管理服务器不等待更新完成,每次返回相同的资源结果集合,则会导致 Envoy 和管理服务器通讯效率大打折扣。

    在同一个流中,新的 DiscoveryRequests 将取代此前具有相同资源类型的 DiscoveryRequest 请求。这意味着管理服务器只需要响应给定资源类型最新的 DiscoveryRequest 请求即可。

    资源提示

    DiscoveryRequest 中的 resource_names 信息作为资源提示出现。一些资源类型,例如 ClusterListener 将使用一个空的 resource_names,因为 Envoy 需要获取对应节点标识的管理服务器的所有 Cluster(CDS)和 Listener(LDS)。对于其他资源类型,如 RouteConfigurations(RDS)和 ClusterLoadAssignments(EDS),则遵循此前的 CDS/LDS 更新,Envoy 能够通过枚举这些资源找到明确的资源。

    LDS/CDS 资源提示信息将始终为空,并且期望管理服务器的每个响应都提供 LDS/CDS 资源的完整状态。不存在的 ListenerCluster 将被删除。如果 RDS 或 EDS 更新中缺少请求的资源,Envoy 将保留此资源的最后已知值。管理服务器能够从 DiscoveryRequest 中的节点标识(node.id)推断出所有所需的 EDS/RDS 资源,在这种情况下,该提示信息可能被丢弃。从 Envoy 的资源角度来看,空的 EDS/RDS DiscoveryResponse 响应实际上表示一个空的资源。

    ListenerCluster 被删除时,其对应的 EDS 和 RDS 资源也会在 Envoy 实例中被删除。为使 EDS 资源能被 Envoy 获取或跟踪,就必须存在已经应用过的 Cluster 定义(如通过 CDS 获取)。RDS 和 Listeners 之间存在类似的关系(如通过 LDS 获取)。

    对于 EDS/RDS ,Envoy 可以为每个给定类型的资源生成不同的流(如每个 ConfigSource 都有自己的上游管理服务器集群)或当指定资源类型的请求发送到同一个管理服务器的时候,允许将多个资源请求组合在一起发送。虽然可以单个实现,但管理服务器应具备为每个请求中的给定资源类型处理一个或多个 resource_names 的能力。下面的两个序列图都可用于获取两个 EDS 资源 {foo,bar}

    资源更新

    如上所述,Envoy 可能会更新 DiscoveryRequest 中出现的 resource_names 列表,其中 DiscoveryRequest 是用来 ACK/NACK 管理服务器的特定的 DiscoveryResponse 。此外,Envoy 后续可能会在给定的 version_info 上发送额外的 DiscoveryRequests ,以使用新的资源提示来更新管理服务器。

    例如,如果 Envoy 在 EDS 版本 X 时仅知道集群 foo,但在随后收到的 CDS 更新时额外获取了集群 bar ,它可能会为版本 X 发出额外的 DiscoveryRequest 请求,并将 {foo,bar} 作为请求的 resource_names

    这里可能会出现竞争状况;如果 Envoy 在版本 X 上发布了资源提示更新请求,但在管理服务器处理该请求之前发送了新的版本号为 Y 的响应,针对 version_infoX 的版本,资源提示更新可能会被解释为拒绝 Y 。为避免这种情况,通过使用管理服务器提供的 nonce,Envoy 可用来保证每个 DiscoveryRequest 对应到相应的 DiscoveryResponse

    管理服务器不应该为含有过期 nonceDiscoveryRequest 发送 DiscoveryResponse 响应。如果向 Envoy 发送的 DiscoveryResponse 中包含了的新 nonce,则此前的 nonce 将过期。在确定新版本可用之前,管理服务器不需要向 Envoy 发送更新。同版本的早期请求将会过期。在新版本就绪时,管理服务器可能会处理同一个版本号的多个 DiscoveryRequests 请求。

    上述资源更新序列表明 Envoy 并不能期待其发出的每个 DiscoveryRequest 都得到 DiscoveryResponse 响应。

    最终一致性考虑

    由于 Envoy 的 xDS API 采用最终一致性,因此在更新期间可能导致流量被丢弃。例如,如果通过 CDS/EDS 仅获取到了集群 X,而且 RouteConfiguration 引用了集群 X;在 CDS/EDS 更新集群 Y 配置之前,如果将 RouteConfiguration 将引用的集群调整为 Y ,那么流量将被吸入黑洞而丢弃,直至集群 Y 被 Envoy 实例获取。

    对某些应用程序,可接受临时的流量丢弃,客户端或其他 Envoy sidecar 的重试可以解决该问题,并不影响业务逻辑。那些对流量丢弃不能容忍的场景,可以通过以下方式避免流量丢失,CDS/EDS 更新同时携带 XY ,然后发送 RDS 更新从 X 切换到 Y ,此后发送丢弃 X 的 CDS/EDS 更新。

    一般来说,为避免流量丢弃,更新的顺序应该遵循 make before break 模型,其中:

    • CDS 首先更新 Cluster 数据(如果有变化)
    • EDS 更新相应 Cluster 的 Endpoint 信息(如果有变化)
    • LDS 更新 CDS/EDS 相应的 Listener
    • RDS 最后更新新增 Listener 相关的 Route 配置
    • 删除不再使用的 CDS cluster 和 EDS endpoints(不再被引用的 endpoint)

    如果没有添加新的集群/路由/监听器,或者在更新期间暂时丢弃流量,则可以独立推送 xDS 更新。请注意,在 LDS 更新的情况下,监听器须在接收流量之前被预热,例如如其配置了依赖的路由,则需要先从 RDS 中获取。添加/删除/更新集群信息时,集群也需要进行预热。另一方面,如果管理平面确保路由更新时所引用的集群已经准备就绪,则路由可以不用预热。

    聚合服务发现(ADS)

    当管理服务器进行资源分发时,通过上述保证交互顺序的方式来避免流量被丢弃是一项很有挑战的工作。ADS 允许单一管理服务器通过单个 gRPC 流来提供所有的 API 更新。配合仔细规划的更新顺序,ADS 可规避更新过程中的流量丢失。使用 ADS,在单个流上可通过类型 URL 来进行复用多个独立的 DiscoveryRequest/DiscoveryResponse 序列。对于任何给定类型的 URL,以上 DiscoveryRequestDiscoveryResponse 消息序列都适用。 更新序列可能如下所示:

    每个 Envoy 实例可使用单独的 ADS 流。

    最小化 ADS 配置的 bootstrap.yaml 片段示例如下:

    node:
      id: <node identifier>
    dynamic_resources:
      cds_config: {ads: {}}
      lds_config: {ads: {}}
      ads_config:
        api_type: GRPC
        grpc_services:
          envoy_grpc:
            cluster_name: ads_cluster
    static_resources:
      clusters:
      - name: ads_cluster
        connect_timeout: { seconds: 5 }
        type: STATIC
        hosts:
        - socket_address:
            address: <ADS management server IP address>
            port_value: <ADS management server port>
        lb_policy: ROUND_ROBIN
        http2_protocol_options: {}
    admin:
      ...
    

    增量 xDS

    增量 xDS 是可用于 ADS、CDS 和 RDS 的单独 xDS 端点,允许以下操作:

    • xDS 客户端对跟踪资源列表进行增量更新。这支持 Envoy 按需/惰性地请求额外资源(例如,当与未知集群相对应的请求到达时)。
    • xDS 服务器可以增量更新客户端上的资源。这可以实现 xDS 资源可伸缩性的目标。管理服务器只需交付更改的单个集群,而不是在修改单个集群时交付所有上万个集群。

    xDS 增量 session 始终位于 gRPC 双向流的上下文中。这允许 xDS 服务器能够跟踪到连接的 xDS 客户端的状态。xDS REST 版本(v1)不支持增量。在增量 xDS 中,nonce 字段是必需的,用于将 IncrementalDiscoveryResponse 与关联的 ACK 或 NACK IncrementalDiscoveryRequest 进行匹配。IncrementalDiscoveryResponse 中的响应消息级别(system_version_info)仅用于调试目的。

    IncrementalDiscoveryRequest 可在以下 3 种情况下发送:

    1. xDS 双向 gRPC 流的初始消息。
    2. 作为对先前的 IncrementalDiscoveryResponse 的 ACK 或 NACK 响应。在这种情况下,response_nonce 被设置为响应中的 nonce 值。到底是 ACK 还是 NACK 可由 error_detail 字段是否出现来区分。
    3. 客户端自发的 IncrementalDiscoveryRequest。此场景下可以从跟踪的 resource_names 集合中动态添加或删除元素。此时必须忽略 response_nonce

    在下面的示例中,客户端连接并接收它的第一个更新并 ACK。第二次更新失败,客户端发送 NACK 拒绝更新。xDS客户端后续会自发地请求 wc 相关资源。

    在下面的示例中,当 xDS 客户端断开重新连接时,支持增量的 xDS 客户端可能会告诉服务器其已经获取的资源从而避免服务端通过网络重新发送它们。

    3. REST-JSON 轮询订阅


    单个 xDS API 可以通过 REST 端点进行同步(长)轮询。除了无持久流与管理服务器交互外,消息交互顺序与上述两个订阅方式相似。在任何时间点,只存在一个未完成的请求,因此响应消息中的 nonce 在 REST-JSON 中是可选的。DiscoveryRequestDiscoveryResponse 的消息编码遵循 JSON 变换 proto3 规范。ADS 不支持 REST-JSON 轮询订阅。

    当轮询周期设置为较小的值时,为了进行长轮询,这时要求避免发送 DiscoveryResponse除非发生了对请求的资源的更改


    -----------他日江湖相逢 再当杯酒言欢-----------

    「真诚赞赏,手留余香」

    杨传胜

    真诚赞赏,手留余香

    使用微信扫描二维码完成支付

    See Also

    隐藏