Mycat分库分表分片方式
创始人
2024-04-06 00:29:23
0
1. 取模分片
idmod-long
3

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
count数据节点的数量,有三个节点值就是3
2. 范围分片

根据指定的字段及其配置的范围与数据节点的对应情况,来决定该数据属于哪一个分片

idrang-long
autopartition-long.txt0

autopartition-long.txt 配置如下:

# range start-end ,data node index
# K=1000,M=10000.
0-500M=0
500M-1000M=1
1000M-1500M=2

含义为 : 0 - 500 万之间的值 , 存储在0号数据节点 ; 500万 - 1000万之间的数据存储在1号数据节点 ; 1000万 - 1500 万的数据节点存储在2号节点 ;

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
mapFile对应的外部配置文件
type默认值为0 ; 0 表示Integer , 1 表示String
defaultNode默认节点的所用:枚举分片时,如果碰到不识别的枚举值, 就让它路由到默认节点 ; 如果没有默认值,碰到不识别的则报错
3. 枚举分片

通过在配置文件中配置可能的枚举值,指定数据分布到不同数据节点上,本规则适用于按照省份或状态拆分数据等业务,配置如下:

statushash-int
partition-hash-int.txt00

partition-hash-int.txt ,内容如下 : 等号左边的为状态值,右边dataNode节点数

1=0
2=1
3=2

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
mapFile对应的外部配置文件
type默认值为0 ; 0 表示Integer , 1 表示String
defaultNode默认节点的所用:枚举分片时,如果碰到不识别的枚举值, 就让它路由到默认节点 ; 如果没有默认值,碰到不识别的则报错
4. 范围求模算法

该算法先进行范围分片,计算出分片组,再进行组内求模
优点: 综合了范围分片和求模分片的优点。分片组内使用求模可以保证组内的数据分布比较均匀,分片组之间采用范围分片可以兼顾范围分片的特点。
缺点: 在数据范围固定值时,存在不方便扩展的情况,列如将dataNode Group size从2扩展为4时,需要进行数据迁移才能完成。

idrang-mod
autopartition-range-mod.txt0

autopartition-range-mod.txt 配置格式 :

#range  start-end , data node group size
0-500M=1
500M1-2000M=2

在上述配置文件中, 等号前面的范围代表一个分片组 , 等号后面的数字代表该分片组所拥有的分片数量;
配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
mapFile对应的外部配置文件
defaultNode默认节点 ; 未包含以上规则的数据存储在defaultNode节点中, 节点从0开始
5. 固定分片hash算法

优点: 这种策略比较灵活,可以均匀分配也可以非均匀分配,各节点的分配比例和容量大小由partitionCount和partitionLength两个参数决定
缺点: 和取模分片类似,不易扩展节点

idbrand_partition

2,1256,512

在示例中配置的分片策略,希望将数据水平分成3份,前两份各占25%,第三份占50%。

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
partitionCount分片个数列表
partitionLength分片范围列表

约束:
1. 分片长度:默认最大2*10,为1024
2. count,length的数组长度必须是一致的
3. 两组数据的对应情况(partitionCount[0]partitionLength[0])=(partitionCount[1]partitionLength[1])
4. 以上分为三个分区:0-255,256-511,512-1023

6. 取模范围算法

该算法先进行取模,然后根据取模值所属范围进行分片。
优点: 可以自主决定取模后数据的节点分布
缺点: dataNode划分节点是事先建好的,需要扩展时比较麻烦。

idsharding-by-pattern
partition-pattern.txt096

partition-pattern.txt 配置如下:

0-32=0
33-64=1
65-96=2

在mapFile配置文件中,1-32即代表id%96后的分布情况,如果在1-32则在分片0上,如果33-64则在分片1上,如果65-96则在分片2上
配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
mapFile对应的外部配置文件
defaultNode默认节点 ; 如果id不是数字, 无法求模, 将分配在defaultNode上
patternValue求模基数

注意 : 取模范围算法只能针对于数字类型进行取模运算 ; 如果是字符串则无法进行取模分片 ;

7. 字符串Hash求模范围算法

与取模范围算法类似,该算法支持数值,符号,字母取模,首先截取长度为prefixLength的字串,在对字串中的每一个字符的ASCII码求和,然后对求和值进行取模运算(sum%patternValue),就可以计算出子串的分片数。
优点: 可以自主决定取模后数据的节点分布
缺点: dataNode划分节点是事先建好的,需要扩展时比较麻烦。
配置如下:

idsharding-by-prefixpattern
partition-prefixpattern.txt596

partition-prefixpattern.txt 配置如下:

# range start-end ,data node index
# ASCII
# 48-57=0-9
# 64、65-90=@、A-Z
# 97-122=a-z
###### first host configuration
0-32=0
33-64=1
65-96=2

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
mapFile对应的外部配置文件
prefixLength截取的位数; 将该字段获取前prefixLength位所有ASCII码的和, 进行求模sum%patternValue ,获取的值,在通配范围内的即分片数 ;
patternValue求模基数

字符串如何计算:

字符串 :gf89f9a
截取字符串的前5位进行ASCII的累加运算 : g - 103f - 1028 - 569 - 57f - 102sum求和 : 103 + 102 + + 56 + 57 + 102 = 420求模 : 420 % 96 = 36
8. 应用指定算法

运行阶段由应用自主决定路由到哪个分片,直接根据字符字串(必须是数字)计算分片好,配置如下:

idsharding-by-substring
0 230

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
startIndex字符子串起始索引
size字符长度
partitionCount分区(分片)数量
defaultPartition默认分片(在分片数量定义时, 字符标示的分片编号不在分片数量内时,使用默认分片)

示例说明:
id=05-100000002,在此配置中代表根据id中从startIndex=0,开始截取size=2位数字即05,05就是获取的分区,如果没传默认分配到defaultPartition.

9. 字符串hash解析算法

截取字符串中的指定位置的子字符串,进行hash算法,算出分片,配置如下:

user_idsharding-by-stringhash
512 20:2

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
partitionLengthhash求模基数 ; length*count=1024 (出于性能考虑)
partitionCount分区数
hashSlicehash运算位 , 根据子字符串的hash运算 ; 0 代表 str.length() , -1 代表 str.length()-1 , 大于0只代表数字自身 ; 可以理解为substring(start,end),start为0则只表示0
10. 一致性hash算法

一致性hash算法有效的解决了分布式数据拓容问题,配置如下:
所谓一致性哈希, 相同的哈希因子计算值总是被划分到相同的分区表中,不会因为分区节点的增加而改变原来数据的分区位置,比如,原来数据 有6个节点,现在有7个节点,原来坐落在6个节点中的数据 ,不会因为新增一个 节点而导致存量数据的分区发生改变, 一般用于数据迁移与合并的场合,解决分布式数据扩容的问题

idmurmur
03160

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
seed创建murmur_hash对象的种子,默认0
count要分片的数据库节点数量,必须指定,否则没法分片
virtualBucketTimes一个实际的数据库节点被映射为这么多虚拟节点,默认是160倍,也就是虚拟节点数是物理节点数的160倍;virtualBucketTimes*count就是虚拟结点数量 ;
weightMapFile节点的权重,没有指定权重的节点默认是1。以properties文件的格式填写,以从0开始到count-1的整数值也就是节点索引为key,以节点权重值为值。所有权重值必须是正整数,否则以1代替
bucketMapPath用于测试时观察各物理节点与虚拟节点的分布情况,如果指定了这个属性,会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件,没有默认值,如果不指定,就不会输出任何东西
11. 自然月分片算法
create_timesharding-by-month
yyyy-MM-dd2022-11-022023-01-02

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
dateFormat日期格式
sBeginDate开始日期
sEndDate结束日期,如果配置了结束日期,则循环分片,其上有3个节点,sEndDate一定要正确
12. 日期分片算法

按照日期来分片

create_timesharding-by-date
yyyy-MM-dd2022-01-012022-12-3110

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
dateFormat日期格式
sBeginDate开始日期
sEndDate结束日期,如果配置了结束日期,则代码数据到达了这个日期的分片后,会重复从开始分片插入
sPartionDay分区天数,默认值 10 ,从开始日期算起,每个10天一个分区

注意: 配置规则的表dataNode的分片,必须和分片规则数量一致,例如:2022-01-01到2022-12-31,每10天一个分片,一共需要37个分片
13. 单月小时算法
单月内按照小时拆分,最小粒度是小时,一天最多可以有24个分片,最小1个分片,下个月从头开始循环,每个月末需要手动清理数据
配置如下:

create_timesharding-by-hour
24

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
splitOneDay一天切分的分片数
13. 日期范围hash算法

其思想和范围取模分片一样,先根据日期进行范围分片求出分片组,再根据时间hash使得短期内数据分布的更均匀;
优点: 可以避免扩容时的数据迁移,又可以一定程度上避免范围分片的热点问题
注意: 要求日期格式尽量精确些,不然达不到局部均匀的目的。

create_timerange-date-hash
yyyy-MM-dd HH:mm:ss2022-01-01 00:00:00610

配置说明:

属性描述
columns标识将要分片的表字段
algorithm指定分片函数与function的对应关系
class指定该分片算法对应的类
dateFormat日期格式 , 符合Java标准
sBeginDate开始日期 , 与 dateFormat指定的格式一致
groupPartionSize每组的分片数量
sPartionDay代表多少天为一组

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
客厅放八骏马摆件可以吗(家里摆... 今天给各位分享客厅放八骏马摆件可以吗的知识,其中也会对家里摆八骏马摆件好吗进行解释,如果能碰巧解决你...
苏州离哪个飞机场近(苏州离哪个... 本篇文章极速百科小编给大家谈谈苏州离哪个飞机场近,以及苏州离哪个飞机场近点对应的知识点,希望对各位有...