达梦数据库学习笔记 – dataWatch守护集群

本站文章除注明转载外，均为本站原创： 转载自love wife love life —Roger的Oracle/MySQL/PostgreSQL数据恢复博客

对于达梦数据库而言，目前其高可用解决方案主要还是以主备守护集群维护，通过datawatch来实现。

我们知道Oracle 主备也是非常成熟的，几乎所有Oracle用户的容灾都使用dataguard/active dataguard来实现，同时我们也知道Oracle standby的状态可以是mount或open read only 只读模式，这样可以进行读写分离。在Oracle 21c版本中，还支持多租户pdb

级别的read only 同步，这是非常牛。然而在达梦数据库中，standby不存在read only模式的说法，就是mount或者open，只是open时数据库角色是standby，仍然是可以进行只读查询的，不允许进行写操作。但从者来看，跟Oracle类似，只是感觉稍微有点别扭。

对于dm8的主备集群部署，相对来讲比较简单，这里我就简单列一下主备的配置情况：

1、主库dm.ini参数

[dmdba@kylin-dm1 enmotech]$ cat dm.ini |grep INI
MAL_INI                         = 1                     #dmmal.ini
ARCH_INI                        = 1                     #dmarch.ini
REP_INI                         = 0                     #dmrep.ini
LLOG_INI                        = 0                     #dmllog.ini
TIMER_INI                       = 0                     #dmtimer.ini
MPP_INI                         = 0                     #dmmpp.ini
DFS_INI                         = 0                     #dmdfs.ini
DSC_FILE_INIT_ASYNC             = 1                     #DSC file init async flag

[dmdba@kylin-dm1 enmotech]$ cat dm.ini |grep INI

MAL_INI = 1 #dmmal.ini

ARCH_INI = 1 #dmarch.ini

REP_INI = 0 #dmrep.ini

LLOG_INI = 0 #dmllog.ini

TIMER_INI = 0 #dmtimer.ini

MPP_INI = 0 #dmmpp.ini

DFS_INI = 0 #dmdfs.ini

DSC_FILE_INIT_ASYNC = 1 #DSC file init async flag

这里主要修改mal_ini和arch_ini。

2、主库dmarch.ini归档相关参数

[dmdba@kylin-dm1 enmotech]$  cat dmarch.ini
[ARCHIVE_REALTIME]
ARCH_TYPE        = REALTIME
ARCH_DEST        = test_dr
[ARCHIVE_LOCAL1]
ARCH_TYPE        = LOCAL
ARCH_DEST        = /opt/dm/dmarch
ARCH_FILE_SIZE   = 256
ARCH_SPACE_LIMIT = 0

[dmdba@kylin-dm1 enmotech]$ cat dmarch.ini

[ARCHIVE_REALTIME]

ARCH_TYPE = REALTIME

ARCH_DEST = test_dr

[ARCHIVE_LOCAL1]

ARCH_TYPE = LOCAL

ARCH_DEST = /opt/dm/dmarch

ARCH_FILE_SIZE = 256

ARCH_SPACE_LIMIT = 0

主库这里arch_dest目录地写standby 实例名称即可，arch_type选择实时同步模式。

3、dmmal.ini

[dmdba@kylin-dm1 enmotech]$ cat dmmal.ini 
MAL_CHECK_INTERVAL = 5                 ##MAL链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5             ##判定MAL链路断开的时间
[MAL_INST1]
MAL_INST_NAME = test         ##实例名，和dm.ini中的INSTANCE_NAME一致
MAL_HOST = 172.20.22.189         ##MAL系统监听TCP连接的IP地址
MAL_PORT = 5237                 ##MAL系统监听TCP连接的端口
MAL_INST_HOST = 172.20.22.189    ##实例的对外服务IP地址
MAL_INST_PORT = 5236             ##实例的对外服务端口，和dm.ini中的PORT_NUM一致
MAL_DW_PORT = 5238             ##实例本地的守护进程监听TCP连接的端口
MAL_INST_DW_PORT = 5239         ##实例监听守护进程TCP连接的端口
[MAL_INST2]
MAL_INST_NAME = test_dr
MAL_HOST = 172.20.22.190
MAL_PORT = 5237
MAL_INST_HOST = 172.20.22.190
MAL_INST_PORT = 5236
MAL_DW_PORT = 5238
MAL_INST_DW_PORT = 5239

[dmdba@kylin-dm1 enmotech]$ cat dmmal.ini

MAL_CHECK_INTERVAL = 5 ##MAL链路检测时间间隔

MAL_CONN_FAIL_INTERVAL = 5 ##判定MAL链路断开的时间

[MAL_INST1]

MAL_INST_NAME = test ##实例名，和dm.ini中的INSTANCE_NAME一致

MAL_HOST = 172.20.22.189 ##MAL系统监听TCP连接的IP地址

MAL_PORT = 5237 ##MAL系统监听TCP连接的端口

MAL_INST_HOST = 172.20.22.189 ##实例的对外服务IP地址

MAL_INST_PORT = 5236 ##实例的对外服务端口，和dm.ini中的PORT_NUM一致

MAL_DW_PORT = 5238 ##实例本地的守护进程监听TCP连接的端口

MAL_INST_DW_PORT = 5239 ##实例监听守护进程TCP连接的端口

[MAL_INST2]

MAL_INST_NAME = test_dr

MAL_HOST = 172.20.22.190

MAL_PORT = 5237

MAL_INST_HOST = 172.20.22.190

MAL_INST_PORT = 5236

MAL_DW_PORT = 5238

MAL_INST_DW_PORT = 5239

对于dmmal.ini中的参数，主备保持参数一致。

4、dmwatcher.ini

[dmdba@kylin-dm1 enmotech]$ cat dmwatcher.ini 
[TEST]
DW_TYPE =GLOBAL                     ##全局守护类型
DW_MODE = AUTO                         ##自动切换模式
DW_ERROR_TIME = 10                     ##远程守护进程故障认定时间
INST_RECOVER_TIME = 60                 ##主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10                 ##本地实例故障认定时间
INST_OGUID = 666666                 ##守护系统唯一OGUID值
INST_INI = /opt/dm/data/enmotech/dm.ini     ##dm.ini配置文件路径
INST_AUTO_RESTART = 1                 ##打开实例的自动启动功能
INST_STARTUP_CMD = /opt/dm/dmdbms/bin/dmserver ##命令行方式启动
RLOG_SEND_THRESHOLD = 0             ##指定主库发送日志到备库的时间阈值，默认关闭
RLOG_APPLY_THRESHOLD = 0             ##指定备库重演日志的时间阈值，默认关闭

[dmdba@kylin-dm1 enmotech]$ cat dmwatcher.ini

[TEST]

DW_TYPE =GLOBAL ##全局守护类型

DW_MODE = AUTO ##自动切换模式

DW_ERROR_TIME = 10 ##远程守护进程故障认定时间

INST_RECOVER_TIME = 60 ##主库守护进程启动恢复的间隔时间

INST_ERROR_TIME = 10 ##本地实例故障认定时间

INST_OGUID = 666666 ##守护系统唯一OGUID值

INST_INI = /opt/dm/data/enmotech/dm.ini ##dm.ini配置文件路径

INST_AUTO_RESTART = 1 ##打开实例的自动启动功能

INST_STARTUP_CMD = /opt/dm/dmdbms/bin/dmserver ##命令行方式启动

RLOG_SEND_THRESHOLD = 0 ##指定主库发送日志到备库的时间阈值，默认关闭

RLOG_APPLY_THRESHOLD = 0 ##指定备库重演日志的时间阈值，默认关闭

对于dmwatcher.ini参数，主备保持一致即可。

5、dmmonitor.ini参数

[dmdba@kylin-dm1 enmotech]$ cat dmmonitor.ini 
MON_DW_Confirm    = 1
MON_LOG_PATH    = /opt/dm/data/log
MON_LOG_INTERVAL  = 60
MON_LOG_FILE_SIZE   = 256
MON_LOG_SPACE_LIMIT  = 1024
[test]
MON_INST_OGUID    = 666666
MON_DW_IP     = 172.20.22.189:5238
MON_DW_IP     = 172.20.22.190:5238

[dmdba@kylin-dm1 enmotech]$ cat dmmonitor.ini

MON_DW_Confirm = 1

MON_LOG_PATH = /opt/dm/data/log

MON_LOG_INTERVAL = 60

MON_LOG_FILE_SIZE = 256

MON_LOG_SPACE_LIMIT = 1024

[test]

MON_INST_OGUID = 666666

MON_DW_IP = 172.20.22.189:5238

MON_DW_IP = 172.20.22.190:5238

同样，主备保持参数一致。

6、数据库设置oguid值，该参数大小随意

–主库设置OGUID值：
SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 1);
sp_set_oguid(666666);
alter database primary;
SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 0);

—备库

设置OGUID值：
SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 1);
sp_set_oguid(666666);
alter database standby;
SP_SET_PARA_VALUE(1, ‘ALTER_MODE_STATUS’, 0);

对于oguid的设置，均将数据库实例启动到mount状态后，登录disql执行即可。oguid的参数设置要与dmwatcher和dmmonitor中的参数保持一致。

7、备份恢复standby

+++主库备份全库
RMAN> backup database '/opt/dm/data/enmotech/dm.ini' full backupset '/opt/dm/dmbak/enmotech_full';
backup database '/opt/dm/data/enmotech/dm.ini' full backupset '/opt/dm/dmbak/enmotech_full';
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
begin redo pwr log collect, last ckpt lsn: 43428 ...
redo pwr log collect finished
EP[0]'s cur_lsn[43428], file_lsn[43428]
Processing backupset /opt/dm/dmbak/enmotech_full
[Percent:100.00%][Speed:0.00M/s][Cost:00:00:02][Remaining:00:00:00]                                 
backup successfully!
time used: 00:00:03.379
RMAN> 
+++传输备份到standby
[dmdba@kylin-dm1 dmbak]$ scp -r enmotech_full dmdba@172.20.22.190:/opt/dm/dmbak
The authenticity of host '172.20.22.190 (172.20.22.190)' can't be established.
ECDSA key fingerprint is SHA256:fKglM4A3W56Dd+7XBJBnDjyI0OqNpKYJLVYdJXHSjoI.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
Warning: Permanently added '172.20.22.190' (ECDSA) to the list of known hosts.
Authorized users only. All activities may be monitored and reported.
dmdba@172.20.22.190's password: 
enmotech_full.bak                                                                                                                                                                100% 7726KB 190.2MB/s   00:00    
enmotech_full.meta                                                                                                                                                               100%   81KB  73.0MB/s   00:00    
[dmdba@kylin-dm1 dmbak]$ 
+++standby进行还原
[dmdba@kylin-dm2 ~]$ dmrman
dmrman V8
RMAN> restore database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full'; 
restore database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';
file dm.key not found, use default license!
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
[Percent:100.00%][Speed:0.00M/s][Cost:00:00:02][Remaining:00:00:00]                                 
restore successfully.
time used: 00:00:02.528
RMAN> recover database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';
recover database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
EP[0]'s cur_lsn[43428], file_lsn[43428]
备份集[/opt/dm/dmbak/enmotech_full]备份过程中未产生日志
recover successfully!
time used: 371.904(ms)
RMAN> 
RMAN> recover database '/opt/dm/data/enmotech/dm.ini' update DB_MAGIC;
recover database '/opt/dm/data/enmotech/dm.ini' update DB_MAGIC;
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
EP[0]'s cur_lsn[43428], file_lsn[43428]
recover successfully!
time used: 00:00:01.039
RMAN> 
update DB_MAGIC;
RMAN>

+++主库备份全库

RMAN> backup database '/opt/dm/data/enmotech/dm.ini' full backupset '/opt/dm/dmbak/enmotech_full';

backup database '/opt/dm/data/enmotech/dm.ini' full backupset '/opt/dm/dmbak/enmotech_full';

Database mode = 0, oguid = 0

Normal of FAST

Normal of DEFAULT

Normal of RECYCLE

Normal of KEEP

Normal of ROLL

begin redo pwr log collect, last ckpt lsn: 43428 ...

redo pwr log collect finished

EP[0]'s cur_lsn[43428], file_lsn[43428]

Processing backupset /opt/dm/dmbak/enmotech_full

[Percent:100.00%][Speed:0.00M/s][Cost:00:00:02][Remaining:00:00:00]

backup successfully!

time used: 00:00:03.379

RMAN>

+++传输备份到standby

[dmdba@kylin-dm1 dmbak]$ scp -r enmotech_full dmdba@172.20.22.190:/opt/dm/dmbak

The authenticity of host '172.20.22.190 (172.20.22.190)' can't be established.

ECDSA key fingerprint is SHA256:fKglM4A3W56Dd+7XBJBnDjyI0OqNpKYJLVYdJXHSjoI.

Are you sure you want to continue connecting (yes/no/[fingerprint])? yes

Warning: Permanently added '172.20.22.190' (ECDSA) to the list of known hosts.

Authorized users only. All activities may be monitored and reported.

dmdba@172.20.22.190's password:

enmotech_full.bak 100% 7726KB 190.2MB/s 00:00

enmotech_full.meta 100% 81KB 73.0MB/s 00:00

[dmdba@kylin-dm1 dmbak]$

+++standby进行还原

[dmdba@kylin-dm2 ~]$ dmrman

dmrman V8

RMAN> restore database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';

restore database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';

file dm.key not found, use default license!

Normal of FAST

Normal of DEFAULT

Normal of RECYCLE

Normal of KEEP

Normal of ROLL

[Percent:100.00%][Speed:0.00M/s][Cost:00:00:02][Remaining:00:00:00]

restore successfully.

time used: 00:00:02.528

RMAN> recover database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';

recover database '/opt/dm/data/enmotech/dm.ini' from backupset '/opt/dm/dmbak/enmotech_full';

Database mode = 0, oguid = 0

Normal of FAST

Normal of DEFAULT

Normal of RECYCLE

Normal of KEEP

Normal of ROLL

EP[0]'s cur_lsn[43428], file_lsn[43428]

备份集[/opt/dm/dmbak/enmotech_full]备份过程中未产生日志

recover successfully!

time used: 371.904(ms)

RMAN>

RMAN> recover database '/opt/dm/data/enmotech/dm.ini' update DB_MAGIC;

recover database '/opt/dm/data/enmotech/dm.ini' update DB_MAGIC;

Database mode = 0, oguid = 0

Normal of FAST

Normal of DEFAULT

Normal of RECYCLE

Normal of KEEP

Normal of ROLL

EP[0]'s cur_lsn[43428], file_lsn[43428]

recover successfully!

time used: 00:00:01.039

RMAN>

update DB_MAGIC;

RMAN>

8、启动主备以及dmwatch和dmmonitor监控。

/opt/dm/dmdbms/bin/dmserver path=/opt/dm/data/enmotech/dm.ini mount &

dmwatcher /opt/dm/data/enmotech/dmwatcher.ini &
dmmonitor /opt/dm/data/enmotech/dmmonitor.ini &

也可以通过注册service的方式来启动数据库。

9、检查监控是否正常

查看/opt/dm/data/enmotech/log 中的dmmonitorlog 即可，如下：

[dmdba@kylin-dm1 ~]$ [monitor]         2022-11-09 09:07:17: Dmwatcher process TEST status switching [OPEN-->MON CONFIRM] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:17  MON CONFIRM    OK        TEST             SUSPEND     PRIMARY   VALID    10       86408129        86408130        
[monitor]         2022-11-09 09:07:18: Dmwatcher process TEST status switching [MON CONFIRM-->FAILOVER] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:17  FAILOVER       OK        TEST             SUSPEND     PRIMARY   VALID    10       86408129        86408130        
[monitor]         2022-11-09 09:07:20: Dmwatcher process TEST status switching [FAILOVER-->OPEN] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:20  OPEN           OK        TEST             OPEN        PRIMARY   VALID    10       86408130        86408130        
[monitor]         2022-11-09 09:07:20: Instance TEST_DR[STANDBY, OPEN, ISTAT_SAME:TRUE] error 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:19  STARTUP        ERROR     TEST_DR          OPEN        STANDBY   INVALID  10       86408126        86408126        
[monitor]         2022-11-09 09:07:20: Dmwatcher process TEST_DR status switching [OPEN-->STARTUP] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:19  STARTUP        ERROR     TEST_DR          OPEN        STANDBY   INVALID  10       86408126        86408126        
[monitor]         2022-11-09 09:07:33: Instance TEST_DR[STANDBY, OPEN, ISTAT_SAME:TRUE] recover to OK 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:32  STARTUP        OK        TEST_DR          OPEN        STANDBY   INVALID  10       86408126        86408126        
[monitor]         2022-11-09 09:07:33: Dmwatcher process TEST_DR status switching [STARTUP-->OPEN] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:32  OPEN           OK        TEST_DR          OPEN        STANDBY   INVALID  10       86408126        86408126        
[monitor]         2022-11-09 09:07:38: Dmwatcher process TEST status switching [OPEN-->RECOVERY] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:38  RECOVERY       OK        TEST             OPEN        PRIMARY   VALID    10       86408142        86408142        
[monitor]         2022-11-09 09:07:42: Dmwatcher process TEST status switching [RECOVERY-->OPEN] 
WTIME                WSTATUS        INST_OK   INAME            ISTATUS     IMODE     RSTAT    N_OPEN   FLSN            CLSN            
2022-11-09 09:07:42  OPEN           OK        TEST             OPEN        PRIMARY   VALID    10       86408143        86408143

[dmdba@kylin-dm1 ~]$ [monitor] 2022-11-09 09:07:17: Dmwatcher process TEST status switching [OPEN-->MON CONFIRM]