sharding/README.md

332 lines
15 KiB
Markdown
Raw Permalink Normal View History

2021-01-26 10:49:53 +08:00
<h1 align="center"> ShardingCore </h1>
2021-01-26 22:18:07 +08:00
2021-01-26 10:49:53 +08:00
2021-03-13 14:06:54 +08:00
`ShardingCore` 是一个支持efcore 2.x 3.x 5.x的一个分库分表的一个简易扩展,针对dbContext实现了无感知开发,针对之前x.0.0.x版本目前在之前的分表功能上支持了分库功能。
目前x.1.0.x的所有版本都支持分库分表,在使用程度上极大的降低了代码侵入性保证开发时候的无感知使用。该框架是基于efcore的虽然没有像sharding-jdbc一样支持任意jdbc的实现但是针对efcore下的框架基本上都适用,
最后如果喜欢本项目的话或者本项目对您有帮助的话麻烦[点我star github 地址](https://github.com/xuejmnet/sharding-core) ,也欢迎各位.neter交流。
2021-01-26 22:13:28 +08:00
### 依赖
2021-03-13 14:06:54 +08:00
Release | EF Core | .NET Standard | .NET (Core) | Sql Server | [Pomelo.EntityFrameworkCore.MySql](https://github.com/PomeloFoundation/Pomelo.EntityFrameworkCore.MySql)
2021-01-26 22:28:50 +08:00
--- | --- | --- | --- | --- | ---
2021-06-16 16:38:34 +08:00
[5.1.x.x](https://www.nuget.org/packages/ShardingCore/5.1.0.20) | >= 5.0.x | 2.1 | 3.0+ | >= 2012 | 5.0.0
2021-06-16 16:36:10 +08:00
[3.1.x.x](https://www.nuget.org/packages/ShardingCore/3.1.0.20) | 3.1.10 | 2.0 | 2.0+ | >= 2012 | 3.2.4
[2.1.x.x](https://www.nuget.org/packages/ShardingCore/2.1.0.20) | 2.2.6 | 2.0 | 2.0+ | >= 2008 | 2.2.6
2021-02-02 21:44:47 +08:00
2021-01-26 22:13:28 +08:00
2021-01-26 10:49:53 +08:00
- [开始](#开始)
2021-02-02 21:44:47 +08:00
- [简介](#简介)
2021-01-26 22:13:28 +08:00
- [概念](#概念)
2021-02-02 21:44:47 +08:00
- [优点](#优点)
- [缺点](#缺点)
2021-01-26 22:15:41 +08:00
- [安装](#安装)
2021-01-26 10:49:53 +08:00
- [配置](#配置)
- [使用](#使用)
2021-01-27 13:38:30 +08:00
- [默认路由](#默认路由)
2021-01-26 22:13:28 +08:00
- [Api](#Api)
2021-01-26 10:49:53 +08:00
- [高级配置](#高级配置)
2021-01-26 22:13:28 +08:00
- [手动路由](#手动路由)
- [自动建表](#自动建表)
2021-01-26 22:35:41 +08:00
- [事务](#事务)
- [批量操作](#批量操作)
2021-01-26 10:49:53 +08:00
- [注意事项](#注意事项)
2021-01-26 22:35:41 +08:00
- [计划(Future)](#计划)
2021-01-27 13:38:30 +08:00
- [最后](#最后)
2021-01-26 22:13:28 +08:00
# 开始
2021-02-02 21:44:47 +08:00
以下所有例子都以Sql Server为例 MySql亦如此
## 简介
2021-03-13 14:06:54 +08:00
该库从最初```2020年12月初```到现在还处于初期阶段,可能或许会有bug也希望各位多多理解,也是为了给.net生态贡献一下,从最初的仅支持单库分表到现在的多数据库分库分表且支持多表join和流式聚合等操作
开发该库也给我自己带了了很多新的编程思路,目前该库支持的分库分表可以进行完全的自定义,基本上可以满足95%以上的
2021-02-02 21:44:47 +08:00
业务需求,唯一的限制就是分表规则必须满足 x+y+z,x表示固定的表名,y表示固定的表名和表后缀之间的联系(可以为空),z表示表后缀,可以按照你自己的任意业务逻辑进行切分,
如:user_0,user_1或者user202101,user202102...当然该库同样适用于多租户模式下的隔离,该库为了支持之后的分库已经重写了之前的union all查询模式,并且支持多种api,
2021-02-03 08:27:20 +08:00
支持多种查询包括```join,group by,max,count,min,avg,sum``` ...等一系列查询,之后可能会添加更多支持,目前该库的使用非常简单,基本上就是针对IQueryable的扩展为了保证
2021-02-02 21:44:47 +08:00
该库的简介目前仅使用该库无法或者说难以实现自动建表,但是只需要配合定时任务该库即可完成24小时无人看管自动管理。该库提供了 [IShardingTableCreator](https://github.com/xuejmnet/sharding-core/blob/main/src/ShardingCore/TableCreator/IShardingTableCreator.cs)
作为建表的依赖,如果需要可以参考 [按天自动建表](https://github.com/xuejmnet/sharding-core/tree/main/samples/Samples.AutoByDate.SqlServer)
2021-01-26 22:13:28 +08:00
## 概念
本库的几个简单的核心概念:
- [Tail]
2021-01-27 13:38:30 +08:00
尾巴、后缀物理表的后缀
2021-01-26 22:13:28 +08:00
- [TailPrefix]
2021-01-26 22:22:08 +08:00
尾巴前缀虚拟表和物理表的后缀中间的字符
2021-01-26 22:13:28 +08:00
- [物理表]
2021-02-02 21:44:47 +08:00
顾名思义就是数据库对应的实际表信息,表名(tablename+ tailprefix+ tail) [IPhysicTable](https://github.com/xuejmnet/sharding-core/blob/main/src/ShardingCore/Core/PhysicTables/IPhysicTable.cs)
2021-01-26 22:13:28 +08:00
- [虚拟表]
虚拟表就是系统将所有的物理表在系统里面进行抽象的一个总表对应到程序就是一个entity[IVirtualTable](https://github.com/xuejmnet/sharding-core/blob/main/src/ShardingCore/Core/VirtualTables/IVirtualTable.cs)
- [虚拟路由]
2021-03-13 14:06:54 +08:00
虚拟路由就是联系虚拟表和物理表的中间介质,虚拟表在整个程序中只有一份,那么程序如何知道要查询系统哪一张表呢,最简单的方式就是通过虚拟表对应的路由[IVirtualTableRoute](https://github.com/xuejmnet/sharding-core/blob/main/src/ShardingCore/Core/VirtualRoutes/IVirtualRoute.cs)
2021-01-26 22:13:28 +08:00
,由于基本上所有的路由都是和业务逻辑相关的所以虚拟路由由用户自己实现,该框架提供一个高级抽象
2021-02-02 21:44:47 +08:00
## 优点
2021-03-13 14:06:54 +08:00
- [支持自定义分库、分表规则]
2021-02-02 21:44:47 +08:00
- [支持任意类型分表key]
- [针对iqueryable的扩展方便使用]
2021-03-13 14:06:54 +08:00
- [支持分表下的连表] ```join,group by,max,count,min,avg,sum```
- [支持针对批处理的使用] ``` BulkInsert、BulkUpdate、BulkDelete```支持efcore的扩展生态
2021-02-02 21:44:47 +08:00
- [提供多种默认分表规则路由] 按时间按取模
- [针对分页进行优化] 大页数跳转支持低内存流式处理
## 缺点
- [消耗连接]出现分表与分表对象进行join如果条件没法索引到具体表会生成```笛卡尔积```导致连接数爆炸,后期会进行针对该情况的配置
- [该库比较年轻] 可能会有一系列bug或者单元测试不到位的情况,但是只要你在群里或者提了issues我会尽快解决
2021-01-26 22:15:41 +08:00
## 安装
```xml
<PackageReference Include="ShardingCore.SqlServer" Version="5.1.0.9" />
2021-01-26 22:15:41 +08:00
```
2021-01-26 22:13:28 +08:00
## 配置
2021-01-27 13:38:30 +08:00
配置entity 推荐 [fluent api](https://docs.microsoft.com/en-us/ef/core/modeling/) 可以实现自动建表功能
2021-03-22 10:09:41 +08:00
`IShardingTable`数据库对象必须继承该接口
`ShardingTableKey`分表字段需要使用该特性
2021-01-26 22:22:08 +08:00
```c#
2021-03-13 14:06:54 +08:00
public class SysUserMod:IShardingTable
2021-01-26 22:22:08 +08:00
{
/// <summary>
2021-02-02 21:44:47 +08:00
/// 用户Id用于分表
2021-01-26 22:22:08 +08:00
/// </summary>
2021-03-13 14:06:54 +08:00
[ShardingTableKey]
2021-01-26 22:22:08 +08:00
public string Id { get; set; }
/// <summary>
2021-02-02 21:44:47 +08:00
/// 用户名称
2021-01-26 22:22:08 +08:00
/// </summary>
public string Name { get; set; }
/// <summary>
2021-02-02 21:44:47 +08:00
/// 用户姓名
2021-01-26 22:22:08 +08:00
/// </summary>
public int Age { get; set; }
}
```
2021-02-02 21:44:47 +08:00
创建virtual route
2021-03-13 14:06:54 +08:00
实现 `AbstractShardingOperatorVirtualTableRoute<T, TKey>`
2021-02-02 21:44:47 +08:00
抽象,或者实现系统默认的虚拟路由
2021-01-27 13:38:30 +08:00
框架默认有提供几个简单的路由 [默认路由](#默认路由)
2021-01-26 22:13:28 +08:00
```c#
2021-03-13 14:06:54 +08:00
public class SysUserModVirtualTableRoute : AbstractSimpleShardingModKeyStringVirtualRoute<SysUserMod>
2021-01-26 22:13:28 +08:00
{
2021-03-13 14:06:54 +08:00
public SysUserModVirtualTableRoute() : base(2,3)
2021-02-02 21:44:47 +08:00
{
}
}
2021-01-26 22:13:28 +08:00
```
`Startup.cs` 下的 `ConfigureServices(IServiceCollection services)`
```c#
2021-02-02 21:44:47 +08:00
services.AddShardingSqlServer(o =>
2021-03-13 14:06:54 +08:00
{
2021-02-02 21:44:47 +08:00
//如果是development就判断并且新建数据库如果不存在的话(ishardingentity不会被创建)
2021-03-13 14:06:54 +08:00
o.EnsureCreatedWithOutShardingTable = true;
2021-02-02 21:44:47 +08:00
//ishardingentity表是否需要在启动时创建(如果已创建可以选择不创建)
2021-03-13 14:06:54 +08:00
o.CreateShardingTableOnStart = true;
//添加分库dbcontext
o.AddShardingDbContextWithShardingTable<DefaultTableDbContext>("conn1", "Data Source=localhost;Initial Catalog=ShardingCoreDB;Integrated Security=True", dbConfig =>
{
//添加分表规则
dbConfig.AddShardingTableRoute<SysUserModVirtualTableRoute>();
});
2021-01-26 22:13:28 +08:00
});
```
`Startup.cs` 下的 ` Configure(IApplicationBuilder app, IWebHostEnvironment env)` 你也可以自行封装[app.UseShardingCore()](https://github.com/xuejmnet/sharding-core/blob/main/samples/Sample.SqlServer/DIExtension.cs)
```c#
var shardingBootstrapper = app.ApplicationServices.GetRequiredService<IShardingBootstrapper>();
shardingBootstrapper.Start();
```
## 使用
```c#
private readonly IVirtualDbContext _virtualDbContext;
public ctor(IVirtualDbContext virtualDbContext)
{
_virtualDbContext = virtualDbContext;
}
public async Task ToList_All()
{
2021-02-03 07:51:44 +08:00
//查询list集合
2021-02-02 21:44:47 +08:00
var all=await _virtualDbContext.Set<SysUserMod>().ToShardingListAsync();
2021-02-03 07:51:44 +08:00
//链接查询
2021-02-02 21:44:47 +08:00
var list = await (from u in _virtualDbContext.Set<SysUserMod>()
join salary in _virtualDbContext.Set<SysUserSalary>()
on u.Id equals salary.UserId
select new
{
Salary = salary.Salary,
DateOfMonth = salary.DateOfMonth,
Name = u.Name
}).ToShardingListAsync();
2021-02-03 07:51:44 +08:00
//聚合查询
var ids = new[] {"200", "300"};
2021-02-02 21:44:47 +08:00
var dateOfMonths = new[] {202111, 202110};
var group = await (from u in _virtualDbContext.Set<SysUserSalary>()
.Where(o => ids.Contains(o.UserId) && dateOfMonths.Contains(o.DateOfMonth))
group u by new
{
UId = u.UserId
}
into g
select new
{
GroupUserId = g.Key.UId,
Count = g.Count(),
TotalSalary = g.Sum(o => o.Salary),
AvgSalary = g.Average(o => o.Salary),
MinSalary = g.Min(o => o.Salary),
MaxSalary = g.Max(o => o.Salary)
}).ToShardingListAsync();
2021-01-26 22:13:28 +08:00
}
```
2021-02-02 21:44:47 +08:00
更多操作可以参考单元测试
2021-01-26 22:13:28 +08:00
## Api
2021-01-28 17:22:06 +08:00
方法 | Method | [SqlServer Unit Test](https://github.com/xuejmnet/sharding-core/blob/main/test/ShardingCore.Test50/ShardingTest.cs) | [MySql Unit Test](https://github.com/xuejmnet/sharding-core/blob/main/test/ShardingCore.Test50.MySql/ShardingTest.cs)
2021-01-27 13:38:30 +08:00
--- |--- |--- |---
2021-02-01 21:49:49 +08:00
获取集合 |ToShardingListAsync |yes |yes
第一条 |ShardingFirstOrDefaultAsync |yes |yes
最大 |ShardingMaxAsync |yes |yes
最小 |ShardingMinAsync |yes |yes
是否存在 |ShardingAnyAsync |yes |yes
分页 |ToShardingPageResultAsync |yes |yes
数目 |ShardingCountAsync |yes |yes
求和 |ShardingSumAsync |yes |yes
2021-02-02 21:44:47 +08:00
分组 |ShardingGroupByAsync |yes |yes
2021-01-27 13:38:30 +08:00
## 默认路由
抽象abstract | 路由规则 | tail | 索引
--- |--- |--- |---
2021-03-13 14:06:54 +08:00
AbstractSimpleShardingModKeyIntVirtualTableRoute |取模 |0,1,2... | `=`
AbstractSimpleShardingModKeyStringVirtualTableRoute |取模 |0,1,2... | `=`
AbstractSimpleShardingDayKeyDateTimeVirtualTableRoute |按时间 |yyyyMMdd | `>,>=,<,<=,=,contains`
AbstractSimpleShardingDayKeyLongVirtualTableRoute |按时间戳 |yyyyMMdd | `>,>=,<,<=,=,contains`
AbstractSimpleShardingWeekKeyDateTimeVirtualTableRoute |按时间 |yyyyMMdd_dd | `>,>=,<,<=,=,contains`
AbstractSimpleShardingWeekKeyLongVirtualTableRoute |按时间戳 |yyyyMMdd_dd | `>,>=,<,<=,=,contains`
AbstractSimpleShardingMonthKeyDateTimeVirtualTableRoute |按时间 |yyyyMM | `>,>=,<,<=,=,contains`
AbstractSimpleShardingMonthKeyLongVirtualTableRoute |按时间戳 |yyyyMM | `>,>=,<,<=,=,contains`
AbstractSimpleShardingYearKeyDateTimeVirtualTableRoute |按时间 |yyyy | `>,>=,<,<=,=,contains`
AbstractSimpleShardingYearKeyLongVirtualTableRoute |按时间戳 |yyyy | `>,>=,<,<=,=,contains`
2021-01-27 13:38:30 +08:00
注:`contains`表示为`o=>ids.contains(o.shardingkey)`
#高级
2021-02-02 21:44:47 +08:00
## 批量操作
批量操作将对应的dbcontext和数据进行分离由用户自己选择第三方框架比如zzz进行批量操作或者batchextension
```c#
virtualDbContext.BulkInsert<SysUserMod>(new List<SysUserMod>())
.BatchGroups.ForEach(pair =>
{
///zzz or other
pair.Key.BlukInsert(pair.Value);
});
var shardingBatchUpdateEntry = virtualDbContext.BulkUpdate<SysUserMod>(o => o.Id == "1", o => new SysUserMod()
{
Name = "name_01"
});
shardingBatchUpdateEntry.DbContexts.ForEach(context =>
{
//zzz or other
context.Where(shardingBatchUpdateEntry.Where).Update(shardingBatchUpdateEntry.UpdateExp);
});
```
2021-02-02 21:44:47 +08:00
## 手动路由
```c#
var shardingQueryable = _virtualDbContext.Set<SysUserMod>().AsSharding();
//禁用自动路由
shardingQueryable.DisableAutoRouteParse();
//添加路由直接查询尾巴0的表
shardingQueryable.AddManualRoute<SysUserMod>("0");
//添加路由针对该条件的路由
shardingQueryable.AddManualRoute<SysUserMod>(o=>o.Id=="100");
var list=await shardingQueryable.ToListAsync();
```
## 自动建表
[参考](https://github.com/xuejmnet/sharding-core/tree/main/samples/Samples.AutoByDate.SqlServer)
## 事务
默认savechanges支持事务如果需要where.update需要手动开启事务
```c#
_virtualDbContext.BeginTransaction();
var shardingBatchUpdateEntry = _virtualDbContext.BulkUpdate<SysUserMod>(o=>o.Id=="123",o=>new SysUserMod()
{
Name = "name_modify"
});
foreach (var dbContext in shardingBatchUpdateEntry.DbContexts)
{
//zzz or other batch
}
await _virtualDbContext.SaveChangesAsync();
```
# 注意事项
该库的IVirtualDbContext.Set<T>使用asnotracking所以基本不支持跟踪,目前框架采用AppDomain.CurrentDomain.GetAssemblies();
可能会导致程序集未被加载所以尽可能在api层加载所需要的dll
2021-02-03 09:53:07 +08:00
使用时需要注意
- 实体对象是否继承`IShardingEntity`
- 实体对象是否有`ShardingKey`
2021-02-04 16:42:49 +08:00
- 实体对象是否映射配置已实现`IEntityTypeConfiguration<TEntity>`
2021-02-03 09:53:07 +08:00
- 实体对象是否已经实现了一个虚拟路由
- startup是否已经添加虚拟路由
```c#
services.AddShardingSqlServer(o =>
{
o.ConnectionString = "";
o.AddSharding<SysUserModVirtualRoute>();
o.UseShardingCoreConfig((provider, config) =>
{
//如果是development就判断并且新建数据库如果不存在的话(ishardingentity不会被创建)
config.EnsureCreated = provider.GetService<IHostEnvironment>().IsDevelopment();
//ishardingentity表是否需要在启动时创建(如果已创建可以选择不创建)
config.CreateShardingTableOnStart = true;
});
});
```
- startup
```c#
var shardingBootstrapper = app.ApplicationServices.GetRequiredService<IShardingBootstrapper>();
shardingBootstrapper.Start();
```
2021-02-02 21:44:47 +08:00
# 计划
- [提供官网如果该项目比较成功的话]
- [开发更完善的文档]
- [支持分库]
- [支持更多数据库查询]
2021-01-27 13:38:30 +08:00
# 最后
2021-02-04 16:42:49 +08:00
该框架借鉴了大部分分表组件的思路,目前提供的接口都已经实现,并且支持跨表查询,基于分页查询该框架也使用了流式查询保证不会再skip大数据的时候内存会爆炸,目前这个库只是一个刚刚成型的库还有很多不完善的地方希望大家多多包涵,如果喜欢的话也希望大家给个star.
2021-02-02 21:57:02 +08:00
该文档是我晚上赶工赶出来的也想趁热打铁希望更多的人关注,也希望更多的人可以交流。
2021-01-27 13:38:30 +08:00
凭借各大开源生态圈提供的优秀代码和思路才有的这个框架,希望可以为.Net生态提供一份微薄之力,该框架本人会一直长期维护,有大神技术支持可以联系下方方式欢迎star :)
2021-02-03 07:51:44 +08:00
[博客](https://www.cnblogs.com/xuejiaming)
2021-01-27 13:38:30 +08:00
QQ群:771630778
个人QQ:326308290(欢迎技术支持提供您宝贵的意见)
个人邮箱:326308290@qq.com