深入 etcd — 架构

etcd 是用go语言实现的一个高可用,强一致性的KV存储系统,而由于作为 Kubernetes 的数据存储和同步的重要组件所以最近很火.

etcd 作为一个存储系统,可用于配置共享和服务发现,它有以下四个特点:

  • 简单: 基于 HTTP+JSON 的 API 让你用 curl 命令就可以轻松使用
  • 安全: 支持SSL通信认证机制
  • 快速: 支持每实例每秒超一千次的写操作
  • 稳定: 内部使用一致性共识算法 Raft 实现了分布式

etcd 内部架构

etcd 主要分为四个部分:

  • HTTP Server: 用于处理用户发送的API请求以及其它 etcd 节点的同步与心跳信息请求
  • Store:用于处理 etcd 支持的各类功能的事务. 包括数据索引,节点状态变更,监控与反馈,事件处理与执行等等, 是 etcd 对用户提供的大多数 API 功能的具体实现
  • Raft:Raft 强一致性算法的具体实现, 是 etcd 的核心
  • WAL:Write Ahead Log(预写式日志),是etcd的数据存储方式.除了在内存中存有所有数据的状态以及节点的索引以外,etcd 就通过 WAL 进行持久化存储.WAL 中,所有的数据提交前都会事先记录日志.Snapshot是为了防止数据过多而进行的状态快照;Entry表示存储的具体日志内容.

一个请求发送过来, 会经由HTTP Server转发给 Store 进行具体的事务处理,如果涉及到节点的修改,则交给 Raft 模块进行状态的变更,日志的记录,然后再同步给别的 etcd 节点以确认数据提交,最后进行数据的提交,再次同步.

etcd 概念词汇表

  • Raft:etcd所采用的保证分布式系统强一致性的算法。
  • Node:一个Raft状态机实例。
  • Member: 一个etcd实例。它管理着一个Node,并且可以为客户端请求提供服务。
  • Cluster:由多个Member构成可以协同工作的etcd集群。
  • Peer:对同一个etcd集群中另外一个Member的称呼。
  • Client: 向etcd集群发送HTTP请求的客户端。
  • WAL:预写式日志,etcd用于持久化存储的日志格式。
  • snapshot:etcd防止WAL文件过多而设置的快照,存储etcd数据状态。
  • Proxy:etcd的一种模式,为etcd集群提供反向代理服务。
  • Leader:Raft算法中通过竞选而产生的处理所有数据提交的节点。
  • Follower:竞选失败的节点作为Raft中的从属节点,为算法提供强一致性保证。
  • Candidate:当Follower超过一定时间接收不到Leader的心跳时转变为Candidate开始Leader竞选。
  • Term:某个节点成为Leader到下一次竞选开始的时间周期,称为一个Term。
  • Index:数据项编号。Raft中通过Term和Index来定位数据。

Reference