告诉你如何打造PostgreSQL闪回环境

  • 来源:网络
  • 更新日期:2020-06-05

摘要: 在 PostgreSQL 数据库;目前是不支持类似 Oracle 闪回特性;我们知道 Oracle 闪回特性在数据恢复是非常简单给力。增加数据库操作人员(开发,DBA)的容错率。Oracl

在 PostgreSQL 数据库;目前是不支持类似 Oracle 闪回特性;我们知道 Oracle 闪回特性在数据恢复是非常简单给力。增加数据库操作人员(开发,DBA)的容错率。Oracle 闪回特性使用场景:

flashback database: 数据库闪回;多用于数据库恢复;数据库,用户,表空间误删。 flashback table : 表闪回;用于数据表恢复;数据表误删。 flashback query : 闪回查询;应用于修复误操作数据。

对于 PostgreSQL 闪回;校长(德哥)有写过一系列的文章PostgreSQL flashback(闪回)功能实现与介绍;如今我取巧实现 PostgreSQL 闪回特性。原理参考我之前的文章PostgreSQL恢复误删数据。

支持在线数据库恢复(不推荐),多用于数据表恢复,修复误操作数据。 支持多次闪回操作;在 flashback query 中恢复的时间点不是很理想;可以重新设定时间点再闪回操作一次。 一. flashback 所需命令

实现 flashback 就是一个有效的数据库备份/恢复。

备份操作命令有 scp/cp, pg_basebackup, pg_rman。我选 pg_basebackup。因为pg_basebackup 支持异构备份。意味着可以在同一台服务器在 cp 一个 PostgreSQL 实例。即可以在一台服务器上实现闪回。 恢复操作有 copy 或者 pg_dump 命令。 二. flashback 所需条件

实现 flashback 可以是在线服务器上操作,也可以是在另一台服务器上操作。换句话说:可以是一台服务器或者是两台服务器来实现。在一台服务器上需要更改数据库端口。由于本环境有清理目录操作;避免在在线服务器上误删目录。所以建议用两条服务器来实现。

三. flashback 搭建原理

本文档采用两台服务器来实现。两台服务器时间校准,免密码登录。

正式数据库环境:192.168.1.201 闪回数据库环境:192.168.1.202
3.1 创建脚本cleandir.sh

cleandir脚本用于在pg_basebackup备份前;先清空备份所需的路径

psql -h 192.168.1.201 -p $PGPORT -t -A -n -cSELECT pg_catalog.pg_tablespace_location(oid) AS Location FROM pg_catalog.pg_tablespace where spcname not in (\'pg_default\',\'pg_global\') -o tablespace_location.txt
awk \'{print rm -rf  $1}\' tablespace_location.txt > cleandir.sh
echo rm -rf $PGDATA >> cleandir.sh 
3.2 创建备份脚本pg_backup.sh

采用pg_basebackup备份;

cleandir.sh
pg_basebackup -F p --progress -D $PGDATA -h 192.168.1.201 -p $PGPORT -U replica 

加入定时任务 crontab 中 例如:每天凌晨过5分执行备份

5 0 * * * pg_backup.sh 
3.3 创建配置文件recovery.conf模板

执行闪回查询/数据库恢复。多用时间点进行恢复即(PITR)

restore_command = \'scp postgres@192.168.1.201:**/%f %p\'
recovery_target_time = \'2018-11-10 10:33:12\' 
3.4 创建恢复脚本pg_flashback.sh

pg_flashback.sh 脚本用于数据库误操作实现闪回到某个时间点。支持多次闪回。执行闪回 之前;需要配置 recovery.conf 中的 “recovery_target_time” 时间点。即恢复到哪个时间点。
第一次执行;执行

pg_flashback.sh 1 

往后执行闪回;通称再次执行;执行命令

pg_flashback.sh 2 

当然往后加也行例如:pg_flashback.sh 3
pg_flashback.sh脚本如下

##===========================================================  
##   pg_flashback.sh                
##   created by lottu           
##   2018/11/07    
##   usage: pg_flashback.sh 1                          
##============================================================  
#!/bin/bash
PGHOME=/opt/pgsql96
PGDATA=/data/postgres/data              
LANG=en_US.utf8
PGPORT=5432
PGUSER=postgres
PGDATABASE=postgres
PG_BACK_HOST_IP=192.168.1.202
E_BADARGS=65
E_FAIL=66

if [ $# -ne 1 ];then
 echo Usage: `basename $0` Please invoke this script with one command-line arguments
 exit $E_BADARGS
fi
flashback_path=/data/flash_back
if [ $1 -eq 1 ];then
 echo Info: backup backupset
 backup.sh
else
 rebackup.sh
fi 
echo Info: edit recovery.conf
#scp recovery.conf postgres@192.168.1.202:$PGDATA
cp /home/postgres/recovery.conf $PGDATA
echo Info: begin start database
pg_ctl start -l /home/postgres/log/pg_server.log
if [ $? -eq 0 ];then
 echo Info: start database succes
 sleep 10
 psql -h $PG_BACK_HOST_IP -p 5432 postgres postgres -c select pg_xlog_replay_resume()
else
 echo [Error]: start database fail
 exit $E_FAIL
fi 
四. flashback 实验验证 4.1 验证目的 验证是否可以闪回/恢复 验证是否可以多次操作闪回 验证在闪回的过程中;正式环境是否正常对外服务 4.2 实验操作 4.2.1 备份数据库

执行pg_backup.sh脚本。部署成功了是没这个操作。因为每天都有定时备份。

[postgres@Postgres202 ~]$ pg_backup.sh 
waiting for server to shut down......... done
server stopped 322503/322503 kB (100%), 4/4 tablespaces 
4.2.2 模拟误操作
lottu=# create table lottu as select * from lottu01 ; SELECT 4 lottu=# select * from lottu; id | text ------+------- 1001 | lottu 1004 | rax 1002 | world 1003 | world (4 rows) -- 获取时间点;这个时间点“2018-11-10 14:56:56”是我目标恢复时间点。表lottu有4条记录。
lottu=# select now(); now ------------------------------ 2018-11-10 14:56:56.30188+08 (1 row) -- 在时间点“2018-11-10 14:57:51”;误操作1 清理表lottu的记录
lottu=# delete from lottu; DELETE 4 lottu=# select now(); now ------------------------------- 2018-11-10 14:57:51.891931+08 (1 row) -- 误操作2 删除表lottu。
lottu=# drop table lottu; DROP TABLE 
获取时间点;这个时间点“2018-11-10 14:56:56”是我目标恢复时间点。表lottu有4条记录。 在时间点“2018-11-10 14:57:51”;误操作1 清理表lottu的记录 误操作2 删除表lottu。 4.2.3 闪回操作

我们先在配置文件 recovery.conf 中的参数“recovery_target_time” 设置为 “2018-11-10 14:57:51”。执行闪回pg_flashback.sh 1

[postgres@Postgres202 ~]$ pg_flashback.sh 1 Info: backup backupset Info: edit recovery.conf Info: begin start database
server starting Info: start database succes
psql: FATAL: the database system is starting up 

闪回数据库成功启动;登录查看表lottu情况:表数据未找回;这不是我所需闪回的目标

[postgres@Postgres202 ~]$ psql lottu lottu
psql (9.6.0) Type help for help. lottu=# \\d lottu Table lottu.lottu Column | Type | Modifiers --------+---------+----------- id | integer | name | text | lottu=# select * from lottu; id | name ----+------ (0 rows) 

在配置文件 recovery.conf 中的参数“recovery_target_time” 设置为 “2018-11-10 14:56:56”。再执行闪回pg_flashback.sh 2

[postgres@Postgres202 ~]$ pg_flashback.sh 2 Info: edit recovery.conf Info: begin start database
server starting Info: start database success
psql: FATAL: the database system is starting up 

再次闪回也成功了。我们在看下表lottu的情况

[postgres@Postgres202 ~]$ psql lottu lottu
psql (9.6.0) Type help for help. lottu=# \\d lottu Table lottu.lottu Column | Type | Modifiers --------+---------+----------- id | integer | name | text | lottu=# select * from lottu; id | name ------+------- 1001 | lottu 1004 | rax 1002 | world 1003 | world (4 rows) 

表 lottu 的数据成功找回。在使用 pg_dump 导出表 lottu 的表结构和数据的脚本;

[postgres@Postgres202 ~]$ pg_dump -d lottu -t lottu.lottu -f lottu.sql [postgres@Postgres202 ~]$ scp lottu.sql postgres@192.168.1.201:/home/postgres 

再到正式数据库上执行

[postgres@Postgres201 ~]$ psql lottu lottu 
psql (9.6.0) Type help for help. lottu=# \\i lottu.sql SET SET SET SET SET SET SET SET SET SET SET CREATE TABLE ALTER TABLE COPY 4 lottu=# \\d lottu Table lottu.lottu Column | Type | Modifiers --------+---------+----------- id | integer | name | text | lottu=# select * from lottu; id | name ------+------- 1001 | lottu 1004 | rax 1002 | world 1003 | world (4 rows) 

在整个闪回过程;除了最后一步是在正式服务器上执行。前面其他操作都是在闪回数据库操作。

4.3 实验结论 可以闪回 可以多次操作 不影响正式环境 五. 其他实现方式参考

PostgreSQL flashback(闪回) 功能实现与介绍

六. 不足 不推荐使用这种方式恢复数据库。多用于ddl/dml误操作恢复。 七. 代码下载

链接:https://pan.baidu.com/s/1j8ZNj3yjxj82MnomzxQkfA
提取码:j4xd