title | aliases | ||
---|---|---|---|
TiKV 配置文件描述 |
|
TiKV 配置文件比命令行参数支持更多的选项。你可以在 etc/config-template.toml 找到默认值的配置文件,重命名为 config.toml 即可。
本文档只阐述未包含在命令行参数中的参数,命令行参数参见 TiKV 配置参数。
- Http API 服务的工作线程数量。
- 默认值:1
- 最小值:1
- gRPC 消息的压缩算法,取值:none, deflate, gzip。
- 默认值:none
- gRPC 工作线程的数量。
- 默认值:4
- 最小值:1
- 一个 gRPC 链接中最多允许的并发请求数量。
- 默认值:1024
- 最小值:1
- tikv 节点之间用于 raft 通讯的链接最大数量。
- 默认值:10
- 最小值:1
- gRPC stream 的 window 大小。
- 默认值:2MB
- 单位:KB|MB|GB
- 最小值:1KB
- gRPC 发送 keep alive ping 消息的间隔时长。
- 默认值:10s
- 最小值:1s
- 关闭 gRPC 链接的超时时长。
- 默认值:3s
- 最小值:1s
- 同时发送 snapshot 的最大个数,默认值:32
- 默认值:32
- 最小值:1
- 同时接受 snapshot 的最大个数,默认值:32
- 默认值:32
- 最小值:1
- endpoint 下推查询请求解码消息时,最多允许的递归层数。
- 默认值:1000
- 最小值:1
- endpoint 下推查询请求处理任务最长允许的时长。
- 默认值:60s
- 最小值:1s
- 处理 snapshot 时最大允许使用的磁盘带宽
- 默认值:1000MB
- 单位:KB|MB|GB
- 最小值:1KB
注意:
该功能目前为实验特性,不建议在生产环境中使用。
统一处理读请求的线程池相关的配置项。该线程池自 4.0 版本起取代原有的 storage 和 coprocessor 线程池。
- 统一处理读请求的线程池最少的线程数量。
- 默认值:1
- 统一处理读请求的线程池最多的线程数量。
- 默认值:CPU * 0.8,但最少为 4
- 统一处理读请求的线程池中线程的栈大小。
- 默认值:10MB
- 单位:KB|MB|GB
- 最小值:2MB
- 统一处理读请求的线程池中单个线程允许积压的最大任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
存储线程池相关的配置项。
- 是否使用统一的读取线程池(在
readpool.unified
中配置)处理存储请求。该选项值为 false 时,使用单独的存储线程池。通过本节 (readpool.storage
) 中的其余配置项配置单独的线程池。 - 默认值:false
- 处理高优先级读请求的线程池线程数量。
- 默认值:4
- 最小值:1
- 处理普通优先级读请求的线程池线程数量。
- 默认值:4
- 最小值:1
- 处理低优先级读请求的线程池线程数量。
- 默认值:4
- 最小值:1
- 高优先级线程池中单个线程允许积压的最大任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
- 普通优先级线程池中单个线程允许积压的最大任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
- 低优先级线程池中单个线程允许积压的最大任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
- Storage 读线程池中线程的栈大小。
- 默认值:10MB
- 单位:KB|MB|GB
- 最小值:2MB
协处理器线程池相关的配置项。
- 是否使用统一的读取线程池(在
readpool.unified
中配置)处理协处理器请求。该选项值为 false 时,使用单独的协处理器线程池。通过本节 (readpool.coprocessor
) 中的其余配置项配置单独的线程池。 - 默认值:如果本节 (
readpool.coprocessor
) 中没有其他配置,默认为 true。否则,为了升级兼容性,默认为 false,请根据需要更改readpool.unified
中的配置后再启用该选项。
- 处理高优先级 Coprocessor 请求(如点查)的线程池线程数量。
- 默认值:CPU * 0.8
- 最小值:1
- 处理普通优先级 Coprocessor 请求的线程池线程数量。
- 默认值:CPU * 0.8
- 最小值:1
- 处理低优先级 Coprocessor 请求(如扫表)的线程池线程数量。
- 默认值:CPU * 0.8
- 最小值:1
- 高优先级线程池中单个线程允许积压的任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
- 普通优先级线程池中单个线程允许积压的任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
- 低优先级线程池中单个线程允许积压的任务数量,超出后会返回 Server Is Busy。
- 默认值:2000
- 最小值:2
Coprocessor 线程池中线程的栈大小,默认值:10,单位:KiB|MiB|GiB。
- 默认值:10MB
- 单位:KB|MB|GB
- 最小值:2MB
存储相关的配置项。
- scheduler 一次获取最大消息个数
- 默认值:10240
- 最小值:1
- scheduler 内置一个内存锁机制,防止同时对一个 key 进行操作。每个 key hash 到不同的槽。
- 默认值:2048000
- 最小值:1
- scheduler 线程个数,主要负责写入之前的事务一致性检查工作。
- 默认值:4
- 最小值:1
- 写入数据队列的最大值,超过该值之后对于新的写入 TiKV 会返回 Server Is Busy 错误。
- 默认值:100MB
- 单位: MB|GB
- TiKV 启动时预占额外空间的临时文件大小。临时文件名为
space_placeholder_file
,位于storage.data-dir
目录下。TiKV 磁盘空间耗尽无法正常启动需要紧急干预时,可以删除该文件,并且将reserve-space
设置为0MB
。 - 默认值:2GB
- 单位: MB|GB
RocksDB 多个 CF 之间共享 block cache 的配置选项。当开启时,为每个 CF 单独配置的 block cache 将无效。
- 是否开启共享 block cache。
- 默认值:true
- 共享 block cache 的大小。
- 默认值:系统总内存大小的 45%
- 单位:KB|MB|GB
raftstore 相关的配置项。
- 数据、log 落盘是否 sync,注意:设置成 false 可能会丢数据。
- 默认值:true
- 开启 Prevote 的开关,开启有助于减少隔离恢复后对系统造成的抖动。
- 默认值:true
- raft 库的路径,默认存储在 storage.data-dir/raft 下。
- 默认值:""
- 状态机 tick 一次的间隔时间。
- 默认值:1s
- 最小值:大于 0
- 发送心跳时经过的 tick 个数,即每隔 raft-base-tick-interval * raft-heartbeat-ticks 时间发送一次心跳。
- 默认值:2
- 最小值:大于 0
- 发起选举时经过的 tick 个数,即如果处于无主状态,大约经过 raft-base-tick-interval * raft-election-timeout-ticks 时间以后发起选举。
- 默认值:10
- 最小值:raft-heartbeat-ticks
- 发起选举时至少经过的 tick 个数,如果为 0,则表示使用 raft-election-timeout-ticks,不能比 raft-election-timeout-ticks 小。
- 默认值:0
- 最小值:0
- 发起选举时最多经过的 tick 个数,如果为 0,则表示使用 raft-election-timeout-ticks * 2。
- 默认值:0
- 最小值:0
- 产生的单个消息包的大小限制,软限制。
- 默认值:1MB
- 最小值:0
- 单位:MB
- 待确认日志个数的数量,如果超过这个数量将会减缓发送日志的个数。
- 默认值:256
- 最小值:大于0
- 单个日志最大大小,硬限制。
- 默认值:8MB
- 最小值:0
- 单位:MB|GB
- 删除 raft 日志的轮询任务调度间隔时间,0 表示不启用。
- 默认值:10s
- 最小值:0
- 允许残余的 raft 日志个数,这是一个软限制。
- 默认值:50
- 最小值:1
- 允许残余的 raft 日志个数,这是一个硬限制。默认值为按照每个日志 1MB 而计算出来的 3/4 region 大小所能容纳的日志个数。
- 最小值:0
- 允许残余的 raft 日志大小,这是一个硬限制,默认为 region 大小的 3/4。
- 最小值:大于 0
- 内存中日志 cache 允许的最长残留时间。
- 默认值:30s
- 最小值:0
- 新节点保护时间,控制迁移 leader 到新加节点的最小时间,设置过小容易导致迁移 leader 失败。
- 默认值:3s
- 最小值:0
- 打开或关闭静默 Region。打开后,如果 Region 长时间处于非活跃状态,即被自动设置为静默状态。静默状态的 Region 可以降低 Leader 和 Follower 之间心跳信息的系统开销。可以通过
raftstore.peer-stale-state-check-interval
调整 Leader 和 Follower 之间的心跳间隔。 - 默认值:true
- 修改对 Region 的状态检查间隔时间。
- 默认值:5 min
- 检查 region 是否需要分裂的时间间隔,0 表示不启用。
- 默认值:10s
- 最小值:0
- 允许 region 数据超过指定大小的最大值,默认为 region 大小的 1/16。
- 最小值:0
- 检查是否需要人工触发 rocksdb compaction 的时间间隔,0 表示不启用。
- 默认值:5m
- 最小值:0
- 延迟删除过期副本数据的时间。
- 默认值:10m
- 最小值:0
- 每轮校验人工 compaction 时,一次性检查的 region 个数。
- 默认值:100
- 最小值:0
- 触发 rocksdb compaction 需要的 tombstone 个数。
- 默认值:10000
- 最小值:0
- 触发 rocksdb compaction 需要的 tombstone 所占比例。
- 默认值:30
- 最小值:1
- 最大值:100
- 触发 region 对 PD 心跳的时间间隔,0 表示不启用。
- 默认值:1m
- 最小值:0
- 触发 store 对 PD 心跳的时间间隔,0 表示不启用。
- 默认值:10s
- 最小值:0
- 触发回收过期 snapshot 文件的时间间隔,0 表示不启用。
- 默认值:5s
- 最小值:0
- snapshot 文件的最长保存时间。
- 默认值:4h
- 最小值:0
- 触发对 lock CF compact 检查的时间间隔。
- 默认值:10m
- 最小值:0
- 触发对 lock CF 进行 compact 的大小。
- 默认值:256MB
- 最小值:0
- 单位:MB
- region 消息队列的最长长度。
- 默认值:40960
- 最小值:0
- 每轮处理的消息最大个数。
- 默认值:4096
- 最小值:0
- 副本允许的最长未响应时间,超过将被标记为 down,后续 PD 会尝试将其删掉。
- 默认值:5m
- 最小值:0
- 允许副本处于无主状态的最长时间,超过将会向 PD 校验自己是否已经被删除。
- 默认值:2h
- 最小值:> abnormal-leader-missing-duration
- 允许副本处于无主状态的时间,超过将视为异常,标记在 metrics 和日志中。
- 默认值:10m
- 最小值:> peer-stale-state-check-interval
- 触发检验副本是否处于无主状态的时间间隔。
- 默认值:5m
- 最小值:> 2 * election-timeout
- 尝试转移领导权时被转移者允许的最大日志缺失个数。
- 默认值:10
- 最小值:10
- 当导入 snapshot 文件需要写数据时,内存写缓存的大小
- 默认值:10MB
- 最小值:0
- 单位:MB
- 触发一致性检查的时间间隔, 0 表示不启用。
- 默认值:0s
- 最小值:0
- region 主可信任期的最长时间。
- 默认值:9s
- 最小值:0
- 为 true 时,以最大分裂 key 为起点的 region 复用原 region 的 key;否则以原 region 起点 key 作为起点的 region 复用原 region 的 key。
- 默认值:true
- 允许删除主开关。
- 默认值:false
- 进行 merge 时,允许的最大日志缺失个数。
- 默认值:10
- 最小值:> raft-log-gc-count-limit
- 触发 merge 完成检查的时间间隔。
- 默认值:10s
- 最小值:大于 0
- 开启 rocksdb delete_range 接口删除数据的开关。
- 默认值:false
- 触发检查过期 SST 文件的时间间隔,0 表示不启用。
- 默认值:10m
- 最小值:0
- 一轮处理读请求的最大个数。
- 默认值:1024
- 最小值:大于 0
- 一轮处理数据落盘的最大请求个数。
- 默认值:1024
- 最小值:大于 0
- 处理数据落盘的线程池线程数。
- 默认值:2
- 最小值:大于 0
- 一轮处理的最大请求个数。
- 默认值:1024
- 最小值:大于 0
- 处理 raft 的线程池线程数。
- 默认值:2
- 最小值:大于 0
- 驱动 future 的线程池线程数。
- 默认值:1
- 最小值:大于 0
coprocessor 相关的配置项。
- 开启按 table 分裂 Region的开关,建议仅在 TiDB 模式下使用。
- 默认值:true
- 批量分裂 Region 的阈值,调大该值可加速分裂 Region。
- 默认值:10
- 最小值:1
- Region 容量空间最大值,超过时系统分裂成多个 Region。
- 默认值:144MB
- 单位:KB|MB|GB
- 分裂后新 Region 的大小,此值属于估算值。
- 默认值:96MB
- 单位:KB|MB|GB
- Region 最多允许的 key 的个数,超过时系统分裂成多个 Region。
- 默认值:1440000
- 分裂后新 Region 的 key 的个数,此值属于估算值。
- 默认值:960000
rocksdb 相关的配置项。
- RocksDB 后台线程个数。
- 默认值:8
- 最小值:1
- RocksDB 进行 subcompaction 的并发个数。
- 默认值:1
- 最小值:1
- RocksDB 可以打开的文件总数。
- 默认值:40960
- 最小值:-1
- RocksDB Manifest 文件最大大小。
- 默认值:128MB
- 最小值:0
- 单位:B|KB|MB|GB
- 自动创建 DB 开关。
- 默认值:true
- WAL 恢复模式,取值:0(TolerateCorruptedTailRecords),1(AbsoluteConsistency),2(PointInTimeRecovery),3(SkipAnyCorruptedRecords)。
- 默认值:2
- 最小值:0
- 最大值:3
- WAL 存储目录,默认:“tmp/tikv/store”。
- 默认值:/tmp/tikv/store
- 归档 WAL 生存周期,超过该值时,系统会删除相关 WAL。
- 默认值:0
- 最小值:0
- 单位:秒
- 归档 WAL 大小限制,超过该值时,系统会删除相关 WAL。
- 默认值:0
- 最小值:0
- 单位:B|KB|MB|GB
- 开启自动优化 Rate LImiter 的配置的开关。
- 默认值:false
- 开启 Pipelined Write 的开关。
- 默认值:true
- 异步 Sync 限速速率。
- 默认值:0
- 最小值:0
- 单位:B|KB|MB|GB
- WritableFileWrite 所使用的最大的 buffer 大小。
- 默认值:1MB
- 最小值:0
- 单位:B|KB|MB|GB
- flush 或者 compaction 开启 DirectIO 的开关。
- 默认值:false
- Rate Limiter 限制速率。
- 默认值:0
- 最小值:0
- 单位:Bytes
- Rate LImiter 模式,取值:1(ReadOnly),2(WriteOnly),3(AllIo)。
- 默认值:2
- 最小值:1
- 最大值:3
- 开启自动优化 Rate LImiter 的配置的开关。
- 默认值:false
- 开启 Pipelined Write 的开关。
- 默认值:true
- 异步 Sync 限速速率。
- 默认值:1MB
- 最小值:0
- 单位:B|KB|MB|GB
- WAL Sync 限速速率,默认:512KB。
- 默认值:512KB
- 最小值:0
- 单位:B|KB|MB|GB
- Info 日志的最大大小。
- 默认值:1GB
- 最小值:0
- 单位:B|KB|MB|GB
- 日志截断间隔时间,如果为0则不截断。
- 默认值:0
- 保留日志文件最大个数。
- 默认值:10
- 最小值:0
- 日志存储目录。
- 默认值:""
Titan 相关的配置项。
- 开启 Titan 开关。
- 默认值:false
- Titan Blob 文件存储目录。
- 默认值:titandb
- 关闭 Titan 对 Blob 文件的 GC 的开关。
- 默认值:false
- Titan 后台 GC 的线程个数。
- 默认值:1
- 最小值:1
rocksdb defaultcf 相关的配置项。
- rocksdb block size。
- 默认值:64KB
- 最小值:1KB
- 单位:KB|MB|GB
- rocksdb block cache size。
- 默认值:机器总内存 * 25%
- 最小值:0
- 单位:KB|MB|GB
- 开启 block cache 开关。
- 默认值:false
- 开启 缓存 index 和 filter 的开关。
- 默认值:true
- 是否 pin 住 L0 的 index 和 filter。
- 默认值:true
- 开启 bloom filter 的开关。
- 默认值:true
- 开启优化 filter 的命中率的开关。
- 默认值:true
- 开启将整个 key 放到 bloom filter 中的开关。
- 默认值:true
bloom filter 为每个 key 预留的长度。
- 默认值:10
- 单位:字节
- 开启每个 block 建立 bloom filter 的开关。
- 默认值:false
- 开启读放大统计的开关,0:不开启,> 0 开启。
- 默认值:0
- 最小值:0
- 每一层默认压缩算法,默认:前两层为 No,后面 5 层为 lz4。
- 默认值:["no", "no", "lz4", "lz4", "lz4", "zstd", "zstd"]
- memtable 大小。
- 默认值:128MB
- 最小值:0
- 单位:KB|MB|GB
- 最大 memtable 个数。
- 默认值:5
- 最小值:0
- 触发 flush 的最小 memtable 个数。
- 默认值:1
- 最小值:0
- base level (L1) 最大字节数,一般设置为 memtable 大小 4 倍。
- 默认值:512MB
- 最小值:0
- 单位:KB|MB|GB
- base level 的目标文件大小。
- 默认值:8MB
- 最小值:0
- 单位:KB|MB|GB
- 触发 compaction 的 L0 文件最大个数。
- 默认值:4
- 最小值:0
- 触发 write stall 的 L0 文件最大个数。
- 默认值:20
- 最小值:0
- 完全阻停写入的 L0 文件最大个数。
- 默认值:36
- 最小值:0
- 一次 compaction 最大写入字节数,默认 2GB。
- 默认值:2GB
- 最小值:0
- 单位:KB|MB|GB
Compaction 优先类型,默认:3(MinOverlappingRatio),0(ByCompensatedSize), 1(OldestLargestSeqFirst),2(OldestSmallestSeqFirst)。
- 默认值:3
- 开启 dynamic level bytes 优化的开关。
- 默认值:true
- RocksDB 文件最大层数。
- 默认值:7
- 每一层的默认放大倍数。
- 默认值:10
- Compaction 方法,可选值为 level,universal。
- 默认值:level
- 开启自动 compaction 的开关。
- 默认值:false
- pending compaction bytes 的软限制。
- 默认值:64GB
- 单位:KB|MB|GB
- pending compaction bytes 的硬限制。
- 默认值:256GB
- 单位:KB|MB|GB
rocksdb defaultcf titan 相关的配置项。
- 最小存储在 Blob 文件中 value 大小,低于该值的 value 还是存在 LSM-Tree 中。
- 默认值:1KB
- 最小值:0
- 单位:KB|MB|GB
- Blob 文件所使用的压缩算法,可选值:no、snappy、zlib、bz2、lz4、lz4hc、zstd。
- 默认值:lz4
- Blob 文件的 cache 大小,默认:0GB。
- 默认值:0GB
- 最小值:0
- 单位:KB|MB|GB
- 做一次 GC 所要求的最低 Blob 文件大小总和。
- 默认值:16MB
- 最小值:0
- 单位:KB|MB|GB
- 做一次 GC 所要求的最高 Blob 文件大小总和。
- 默认值:64MB
- 最小值:0
- 单位:KB|MB|GB
- Blob 文件 GC 的触发比例,如果某 Blob 文件中的失效 value 的比例高于该值才可能被 GC 选中。
- 默认值:0.5
- 最小值:0
- 最大值:1
- 进行 GC 时,对 Blob 文件进行采样时读取数据占整个文件的比例。
- 默认值:0.1
- 最小值:0
- 最大值:1
- Blob 文件的大小小于该值时,无视 discardable-ratio 仍可能被 GC 选中。
- 默认值:8MB
- 最小值:0
- 单位:KB|MB|GB
- Titan 的运行模式选择,可选值:
- "normal":value size 超过 min-blob-size 的数据会写入到 blob 文件。
- "read_only":不再写入新数据到 blob,原有 blob 内的数据仍然可以读取。
- "fallback":将 blob 内的数据写回 LSM。
- 默认值:"normal"
- 是否通过开启 level-merge 来提升读性能,副作用是写放大会比不开启更大。
- 默认值:false
- 是否开启使用 merge operator 来进行 Titan GC 写回操作,减少 Titan GC 对于前台写入的影响。
- 默认值:false
rocksdb writecf 相关的配置项。
- block cache size。
- 默认值:机器总内存 * 15%
- 单位:MB|GB
- 开启优化 filter 的命中率的开关。
- 默认值:false
- 开启将整个 key 放到 bloom filter 中的开关。
- 默认值:false
rocksdb lockcf 相关配置项。
- block cache size。
- 默认值:机器总内存 * 2%
- 单位:MB|GB
- 开启优化 filter 的命中率的开关。
- 默认值:false
- 触发 compaction 的 L0 文件个数。
- 默认值:1
raftdb 相关配置项。
- RocksDB 后台线程个数。
- 默认值:2
- 最小值:1
- RocksDB 进行 subcompaction 的并发数。
- 默认值:1
- 最小值:1
- WAL 存储目录。
- 默认值:/tmp/tikv/store
安全相关配置项。
- CA 文件路径
- 默认值:""
- 包含 X509 证书的 PEM 文件路径
- 默认值:""
- 包含 X509 key 的 PEM 文件路径
- 默认值:""
用于 TiDB Lightning 导入及 BR 恢复相关的配置项。
- 处理 RPC 请求线程数。
- 默认值:8
- 最小值:1
- 并发导入工作任务数。
- 默认值:8
- 最小值:1
用于 BR 备份相关的配置项。
- 处理备份的工作线程数。
- 默认值:CPU * 0.75,但最大为 32
- 最小值:1
- 开启悲观事务支持,悲观事务使用方法请参考 TiDB 悲观事务模式。
- 默认值:true
- 悲观事务在 TiKV 中等待其他事务释放锁的最长时间。若超时则会返回错误给 TiDB 并由 TiDB 重试加锁,语句最长等锁时间由
innodb_lock_wait_timeout
控制。 - 默认值:1s
- 最小值:1ms
- 悲观事务释放锁时,只会唤醒等锁事务中
start_ts
最小的事务,其他事务将会延迟wake-up-delay-duration
之后被唤醒。 - 默认值:20ms
- 开启流水线式加悲观锁流程。开启该功能后,TiKV 在检测数据满足加锁要求后,立刻通知 TiDB 执行后面的请求,并异步写入悲观锁,从而降低大部分延迟,显著提升悲观事务的性能。但有较低概率出现悲观锁异步写入失败的情况,可能会导致悲观事务提交失败。
- 默认值:false