1. 背景

项目中要做国产化,MySQL要替换成达梦8数据库。项目中MySQL的建表语句和内置数据通过.sql文件维护,安装时会初始化表结构和表内置数据。项目架构为SpringBoot + JPA / Mybatis。适配工作内容包括数据库迁移、数据导出、项目中的配置更改和相关问题解决方案。

2. 数据处理流程

1. 前期装备

1. 安装达梦8数据库

达梦官网有提供安装包,根据自己的场景进行选择,linux_x86或者linux_aarch64,由于我们项目要全面国产化,所以服务器用的国产华为的鲲鹏服务器(aarch64),操作系统为国产银河麒麟V10。安装步骤按官网提供的文档就行,下载后安装包里也会有一些PDF说明文档可参考。

2. 创建库,启动

安装时如果选择了图形化界面安装,则有DM数据库配置助手工具,可用此工具来创建数据库实例,配置的话中间有个大小写是否敏感配置,此配置默认选择不敏感,否则可能后面会有坑(后面说),安装时记得把客户端也选上,后面用其客户端进行操作,其他配置的话默认就行。安装完成后其中默认用户为SYSDBA,默认端口为5236。linux环境创建数据库实例传送:dm实例创建步骤

2. 库数据处理

这一步的处理主要是将之前项目中存储的.sql文件中MySQL的表结构和表数据相关sql转换为达梦数据库所支持的sql,并且同样保存为.sql文件,后续项目运行之前直接用sql文件进行建表导数据等初始化操作。大概思想如下:

1.先把之前sql文件(MySQL)导入到MySQL数据库中

2.利用达梦的数据迁移工具把MySQL库中的数据迁移到达梦数据库中

3.利用达梦数据库迁移工具把达梦数据库中的数据导出到sql文件,此时sql文件中的sql语句就可在达梦数据库中执行

1. 数据迁移

如果安装时选择安装了客户端工具,则会生成一些客户端操作工具,如迁移工具、DM管理工具、SQL交互式查询工具等。迁移时选择DM数据迁移工具,按照工具内的步骤,选择MySQL服务和数据库以及要迁移的DM数据库。

1.新建迁移,按需选择,我这边是MySQL -> DM。

2.选择数据源迁移时可以指定Mysql数据库的驱动,配置一下jdbc驱动和连接参数即可。达梦的话就是用默认驱动即可。

3.迁移策略,可选择保持对象名大小写,如果MySQL中表字段有用到json类型的字段时,需要手动配置一下类型映射关系,将JSON转成VARCHAR,并设置长度,因为达梦没不支持json类型,迁移时他会默认转成VARCHAR,但是长度会变得很大(具体忘记了),这时某些场景查询时会报错,配置成8188即可,按图配置即可

4.后面选择迁移模式的话全选即可,没什么需要特殊注意的点

2.数据导出

第三步迁移完成后,此时达梦数据库已经有和MySQL同名的库(dm中是schema概念)和表数据了。接下来要把库中的数据导出为.sql文件,到时候放到项目中安装时用来初始化表及数据。

此时仍然需要用达梦的数据迁移工具,新建数据迁移,选择数据迁移方式为DM -> SQL,然后指定需要迁移的数据源(达梦中的scheme),然后导出到目标文件即可。

3. 项目适配(重点)

1. 库名问题

问题:导出后的达梦sql脚本你会发现,建表语句格式为schema.table,并且主键自增关键字变成了IDENTITY。项目中如果用SYSDBA用户连接或者别的用户连接时,执行sql语句都要加上schema(可以理解为mysql的库名,后续就说库名了),如select * from “MY_DB”.“T_USER_TEST”,如不加库名则会报错,当然不可能把项目中所有的sql都改一遍

-- mysql

CREATE TABLE `T_USER_TEST`

(

"id" BIGINT NOT NULL AUTO_INCREMENT,//主键自增

"name" VARCHAR(255) NULL

);

-- 达梦

CREATE TABLE "MY_DB"."T_USER_TEST"

(

"id" BIGINT IDENTITY(1,2) NOT NULL,//主键自增

"name" VARCHAR(255) NULL

);

解决方案:创建一个用户,用户名为库名,创建用户后达梦会自动创建一个和用户名相同的库,此时用此用户登录连接,执行sql语句时表名前面就不需要加库名了,因为他默认查的就是此用户下的库。语句如下(包括创建表空间、赋权等),后续连接时使用此账号和密码以及url连接中的schema(MY_DB)

-- 创建表空间MY_DB

CREATE tablespace MY_DB DATAFILE 'MY_DB.DBF' SIZE 128;

-- 创建用户MY_DB,密码为123456,此时会自动创建名为MY_DB的schema

CREATE USER "MY_DB" IDENTIFIED BY "123456" DEFAULT tablespace MY_DB;

-- 为MY_DB用户赋权

grant "DBA","RESOURCE","PUBLIC","SOI" to "MY_DB" with admin option;

grant EXECUTE on "SYS"."DBMS_XMLGEN" to "MY_DB";

Spring数据库连接配置参考:

#dm8连接

spring.datasource.url=jdbc:dm://127.0.0.1:5236/MY_DB

spring.datasource.username=MY_DB

spring.datasource.password=123456

spring.datasource.driver-class-name=dm.jdbc.driver.DmDriver

spring.datasource.type=com.alibaba.druid.pool.DruidDataSource

#如果项目中有使用到JPA,参考如下方言配置

spring.jpa.properties.hibernate.dialect=org.hibernate.dialect.DmDialect

spring.jpa.properties.hibernate.hbn2ddl.auto=none

spring.jpa.properties.hibernate.temp.use_jdbc_metadata_defaults=false

2. 主键自增问题

1. 问题剖析

首先,达梦数据库是支持主键自增的,DDL中自增关键字为IDENTITY,假如我们表中的id字段设置的为自增id,insert语法常见如下三种:

-- 如下建表语句,id为自增id

CREATE TABLE "MY_DB"."t_user_test"

(

"id" BIGINT IDENTITY(1,2) NOT NULL,//主键自增

"name" VARCHAR(255) NULL

);

-- 1.insert的正确姿势,此时会生成则增id

insert into "t_user_test"(name) values("tom");

-- 2.错误示范,此时会报错:仅当指定列列表,且SET IDENTITY_INSERT为ON时,才能对自增列赋值

insert into "t_user_test"(id,name) values(1,"tom");

-- 3.错误示范,此时会报错: 仅当指定列列表,且SET IDENTITY_INSERT为ON时,才能对自增列赋值或者违反列[id]非空约束

insert into "t_user_test"(id,name) values(null,"tom");

1.第一种插入没问题,无可厚非

2.第二种插入会报错,意思就是说,你的id设置的为自增列,但是你插入时对自增列手动赋值,这是不允许的,设置了自增就应该用数据库的自增生成。但是项目中难免有手动设置id插入的场景,此时也是有解决方案的,就是在插入之前设置IDENTITY_INSERT为ON。注意IDENTITY_INSERT关键字是表级别的关键字,语法要指定到表,不能对全库进行设置。

-- 设置t_user_test表

SET IDENTITY_INSERT MY_DB.t_user_test ON

insert into("id","name") values(1,"tom");

-- OFF可以不执行,不影响

SET IDENTITY_INSERT MY_DB.t_user_test OFF

针对IDENTITY_INSERT问题,本人做了一些测试,得出以下结论供参考:

如需要使用数据库主键自增特性,需要在主键列上声明IDENTITY 当insert语句时,如果手动设置id值,则需要设置此表的IDENTITY_INSERT为 ON 执行完不关闭(SET IDENTITY_INSERT MY_DB.t_user_test OFF),再次插入id为空的值还是可以自增的 不同会话之间执行SET IDENTITY_INSERT MY操作不会互相影响 同一会话同一时刻只能有一张表IDENTITY_INSERT 设置为ON,后面会覆盖前面的,同一会话多次设置只有最后一次设置生效 当insert语句中,如果id显示插入,并且value为null,则会报非空约束的问题

开启语句:SET IDENTITY_INSERT db.table ON

关闭语句:SET IDENTITY_INSERT db.table OFF

3.第三种插入报错很明显,当你没有设置IDENTITY_INSERT时,他会先报错让你对其设置为ON,如果设置完后就会报错违反id非空约束,因为id建表时为主键,自带非空约束。不能显示插入null值,此种错误只能对sql进行处理,后面会讲。

2. 问题处理

经过以上问题分析,insert某张表时,可以先设置IDENTITY_INSERT为ON,虽然只有第一种insert不需要设置,可以直接走自增,但是你设置后也不会影响insert的执行,为了偷懒不想整理项目中的sql,索性所有insert都设置IDENTITY_INSERT为ON。当然你可以写sql,修改项目中的代码,在所有insert操作之前都执行一遍INDENTITY_INSERT ON,但是代码中持久层框架用了JPA和Mybatis,并且此类sql很多,所以采用AOP的方式解决。

JPA

解决思路:在我们项目中使用JPA保存对象实现插入都是间接调用JpaRepository.save()方法,所以在此方法加一层拦截处理就行了,执行save之前先执行SET IDENTITY_INSERT ON,参考代码如下:

@Aspect

@Component

public class JpaSaveAspect {

public static final String IDENTITY_INSERT_ON = "SET IDENTITY_INSERT MY_DB.%s ON";

public static final String IDENTITY_INSERT_OFF = "SET IDENTITY_INSERT MY_DB.%s OFF";

@Autowired

private JdbcTemplate jdbcTemplate;

// 节点为JpaRepository.save

@Pointcut("execution(* org.springframework.data.jpa.repository.JpaRepository.save(..))")

public void savePointcut() {

}

//执行切点方法之前要进行的处理

@Before("savePointcut()")

public void beforeSave(JoinPoint joinPoint) {

Object[] args = joinPoint.getArgs();

if (Objects.isNull(args) || args.length != 1) {

return;

}

Object obj = args[0];

Class clazz = obj.getClass();

Annotation[] annotations = clazz.getAnnotations();

Long id = null;

try {

//通过反射获取save的实体对象,并通过getId方法获取里面的id值,也就是主键值

Method method = clazz.getMethod("getId");

id = (Long) method.invoke(obj);

} catch (Exception e) {

}

// 当id(主键)为空时,不需要处理,因为此时走的数据库的自增

if (Objects.isNull(id) || id <= 0){

return;

}

for (Annotation annotation : annotations) {

// 获取JPA实体的@Tabel注解,解析出表名

if (annotation instanceof Table) {

Table tableAnnotation = (Table) annotation;

//表名拼接进sql进行执行,SET IDENTITY_INSERT MY_DB.t_user ON

String identityInsertOn = String.format(IDENTITY_INSERT_ON, tableAnnotation.name());

log.warn("JPA IDENTITY_INSERT_ON:{}", identityInsertOn);

jdbcTemplate.execute(identityInsertOn);

}

}

}

}

Mybatis

解决思路:Mybatis提供的有自己的拦截器,也叫插件,只需要自定义拦截器即可,使用方式是实现org.apache.ibatis.plugin.Interceptor接口并注册为Bean,并在Mybatis的SqlSessionFactory设置此拦截器使其生效。对这块不熟的可以网上看看相关资料。接下来拦截器中就可以拦截sql并在sql执行之前做处理了。参考代码如下:

代码处理的问题:

1.处理非法字符,如删掉sql中的`字符

2.处理boolean参数,达梦的bit类型对应java中的boolean类型,把sql中的true和false关键字替换为1和0

3.处理主键自增

在执行insert之前执行SET IDENTITY_INSERT,由于本人对Mybatis不太熟,没在拦截器中找到sqlSersion对象,也就没法通过sqlSersion来执行我自定义的sql。而通过调用jdbcTemplate等三方执行,可能导致两个sql不在一个会话中执行,也就导致可能你执行的SET IDENTITY_INSERT不在此会话生效(看上面IDENTITY_INSERT的测试结果),此时你可以通过在insert 语句所在的方法加事务尝试解决。目前我是通过拼接sql方式解决,在拦截器中把解析出来的sql前面拼接自定义sql。(会话的问题和事务我也只是猜测,并没实际验证,仅供参考)

/**

* @description: mybatis sql拦截器,作用有三种:1.处理非法字符 2.处理boolean参数 3.处理插入主键自增问题

*/

@Intercepts({

@Signature(type = StatementHandler.class, method = "prepare", args = {Connection.class, Integer.class})

})

@Slf4j

@Component

public class MybatisSqlInterceptor implements Interceptor {

/**

* 正则不区分大小写匹配"=true",包括=中间有空白字符

*/

private static final String SQL_TRUE_PARAM_REG = "(?i)=\\s*true";

/**

* 正则不区分大小写匹配"=false",包括=中间有空白字符

*/

private static final String SQL_FALSE_PARAM_REG = "(?i)=\\s*false";

/**

* 正则匹配insert into和merge into语句

*/

private static final String SQL_INSERT_REG = "(?i)(insert into|merge into)\\s+([^\\s]+)";

/**

* 开启insert开关

*/

private static final String IDENTITY_INSERT_ON = "SET IDENTITY_INSERT MY_DB.%s ON;";

/**

* 无主键的关联表

*/

private Set identityInsertExcludeTableSet;

//配置,可配置库中无自增键的表,把它过滤掉,因为这些表没有主键自增问题

@Value("${mybatis.insert.exclude.table:t_no_identity_table_test}")

private String excludeTable;

@PostConstruct

public void initExcludeTableSet() {

//加载时将excludeTable的表放入HaseSet,提升后续匹配效率

identityInsertExcludeTableSet = Arrays.stream(excludeTable.split(","))

.collect(Collectors.toSet());

}

@Override

public Object intercept(Invocation invocation) throws Exception {

StatementHandler statementHandler = (StatementHandler) invocation.getTarget();

MetaObject metaObject = SystemMetaObject.forObject(statementHandler);

MappedStatement mappedStatement = (MappedStatement) metaObject.getValue("delegate.mappedStatement");

SqlCommandType sqlCommandType = mappedStatement.getSqlCommandType();

BoundSql boundSql = statementHandler.getBoundSql();

String sql = this.handleIllegalChar(boundSql.getSql());

if (sqlCommandType == SqlCommandType.SELECT) {

sql = this.handleBooleanParam(sql);

}

if (sqlCommandType == SqlCommandType.INSERT) {

sql = this.handleIdentityInsertOn(sql);

}

metaObject.setValue("delegate.boundSql.sql", sql);

return invocation.proceed();

}

/**

* 处理非法字符

*

* @param sql

* @return: java.lang.String

*/

private String handleIllegalChar(String sql) {

return sql.replace("`", "");

}

/**

* 处理插入时自增id开关问题

*

* @param sql

*/

private String handleIdentityInsertOn(String sql) {

String tableName = null;

Pattern pattern = Pattern.compile(SQL_INSERT_REG, Pattern.CASE_INSENSITIVE);

Matcher matcher = pattern.matcher(sql);

if (matcher.find()) {

tableName = matcher.group(2);

}

if (StringUtils.isNotBlank(tableName)

&& !identityInsertExcludeTableSet.contains(tableName)) {

String identityInsertOn = String.format(IDENTITY_INSERT_ON, tableName);

log.warn("Mybatis IDENTITY_INSERT_ON:{}", identityInsertOn);

sql = identityInsertOn + sql;

}

return sql;

}

/**

* 处理sql中的布尔值

*

* @param sql

* @return: java.lang.String

*/

private String handleBooleanParam(String sql) {

return sql.replaceAll(SQL_TRUE_PARAM_REG, "= 1")

.replaceAll(SQL_FALSE_PARAM_REG, "= 0");

}

}

3. SQL语法相关问题

安装时能要求大小写不敏感尽量选择大小写不敏感,不然建表时字段都要用大写,如果用小写,查询时字段用小写查可能会报错:无效列名等

1. 字段column

字段名称关键字冲突

数据库中都有一些自己的关键字,如果建的表中有些关键字和数据库中的冲突,就有可能执行某些sql报错,此类冲突的关键字尽量手动改掉,以下是我遇到的关键字供参考:

logic、comment、domain

字段类型

1)mysql中的json类型对应dm8中的varchar类型,但尽量指定大小,不然聚合查询可能报错

2)bit类型Mysql可使用true和false进行查询,dm只能使用0和1查询

2. 函数及语法

1.GROUP_CONCAT语法要换成WM_CONCAT(其它函数可自行百度,资料很多,也可参考oracle语法)

2.如果用到group by,则select的列必须都是分组内的,报错参考:不是 GROUP BY 表达式。

可根据场景看看是否能删除group by替换为select DISTINCT xxx等

3.select DISTINCT对字段去重时,去重字段中不能有blob或者clob,如text类型的字段,也就是不能把text 类型的字段放到DISTINCT后面,报错参考:试图在blob或者clob列上排序或比较

4.如果使用到mysql的on duplicate key,在达梦8中可以用MERGE INTO语法进行替换(mybatis中批量插 入更新)。

5.if语句,达梦支持if语句,但只能支持简单的场景,如下

-- 支持

where if(id>1,2,3)

-- 不支持

where if(1 = 1,status = 2 or status =3 ,1=1)

以上不支持的场景可以用逻辑解决:

where ((1 = 1 AND (status = 2 OR status = 3)) OR (1 = 1))

4. 其它问题

我们项目中用到了clickhouse数据库,并且使用了clickhouse的字典表连接了外部数据库,也就是Mysql中的某些表,作用是可以吧mysql某些表里的某些数据同步到clickhouse映射表中,并且建立好映射表后,后期clickhouse中表的数据可自动同步mysql表中的数据,如不了解的可去ck官网查看 https://clickhouse.com/docs/zh/sql-reference/dictionaries/external-dictionaries/external-dicts-dict-sources#dicts-external_dicts_dict_sources-mysql

问题:clickhouse内置支持mysql的字典表,但不支持达梦8,

解决:clickhouse提供了bridge方式,如clickhouse-jdbc-bridge、clickhouse-odbc-bridge,大概意思就是提供了个中间件,它是以独立进程来启动,他来作为ck和外部数据库的桥接来自动同步数据。

1. ODBC

环境依赖:unixODBC + 达梦8的odbc驱动

其中unixODBC可根据操作系统下载rpm包或者下载源码进行编译(网上有教程)

odbc驱动可以从安装达梦8所在的服务器上找,安装目录下有个drivers文件,里面有各种驱动,包括odbc,把驱动文件(.so)以及相关依赖拷贝到ck服务器,然后在unixODBC的配置文件中添加dm的数据源和驱动配置路径,然后再ck中创建字典表,并且指定达梦数据源。

这种方式本人在x86机器验证过,是可行的,但是unixODBC有版本问题,达梦8odbc驱动是.so文件链接库,同时有依赖其他链接库,操作不好就会有链接缺失的问题。本人就是后面x86验证后,拿到aarch64架构机器去验证时,依赖的加解密so库和系统中内置的冲突了,但是又没找到法子对其进行环境隔离,故后面放弃了。

2.JDBC

实际中本人是采用这种方式,开始没采用是因为当时看到了jdbc-bridge,但还是想找一种字典表的方式,想着看看字典表支不支持配置自定义连接数据源,就越走越远,后面又用了ODBC开始踩坑,一直踩到国产环境编译动态库后冲突问题,作为java程序员已经走不动了,就蓦然回首从0开始踩坑jdbc,中间jdbc还有一些踩坑历程就不说了,下面直接说结论吧。

clickhouse-jdbc-bridge源码地址:https://github.com/ClickHouse/clickhouse-jdbc-bridge

源码地址有说明,因为是采用java代码编写的,所以没有跨平台的问题,直接下载rpm包安装即可:

wget https://github.com/ClickHouse/clickhouse-jdbc-bridge/releases/download/v2.1.0/clickhouse-jdbc-bridge-2.1.0-1.noarch.rpm

rpm -ivh clickhouse-jdbc-bridge-2.1.0-1.noarch.rpm

1.安装后需要把达梦8的jdbc驱动放入某个文件,后面配置要指定此驱动

2.在jdbc-bridge的安装目录(默认为/etc/clickhouse-jdbc-bridge/config/datasources),新建.json文件,里面配置你的数据库相关连接(驱动、url、账号、密码等信息)

3.运行启动clickhouse-jdbc-bridge(默认端口9019)

3.配置clickhouse的config.xml文件,配置jdbc-bridge连接,重启clickhouse服务

127.0.0.1

9019

4.在clickhouse客户端执行建表语句,示例如下,其中dm8参数是clickhouse-jdbc-bridge数据源配置的名称,DM_DB是达梦数据库的schema名,后面是将查询的结果放入ck表,这个位置也可以直接写表名。

CREATE TABLE ck_user_test (

id UInt64,

name String

)

ENGINE = JDBC('dm8', 'DM_DB', 'select id,name from t_dm_user_test WHERE xxx=0')

建表成功后再ck中就可以查询ck_user_test这张表了,数据同步周期可配置,具体其他配置可参考官网或自行百度

参考链接

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。