gprestore 是专门用来做gpdb数据恢复的并行恢复工具,配合 gpbackup 使用,编译安装方式与 gpbackup 一样,无论是官方下载的软件包还是自行编译的软件包,均会有gprestore这个命令。
下面我们仍然采用与中篇一样的套路来进行演示,首先把 gprestore 的详细命令给大家贴一下,然后通过实验的方式做几个具体场景的解释。在本文的最后,对整个工具进行一个总结,希望对大家日后使用有所帮助。
1
gprestore备份参数详解
如果要使用gprestore进行数据库恢复,那就要求您必须已经使用gpbackup进行了数据库备份,恢复时通过指定 --timestamp 参数把备份集传给gprestore。如果您指定的是一个增量备份的时间戳,那这个增量备份的base全量备份及其他增量文件必须均存在,恢复时会校验备份集合的完整性,防止恢复出错。
在恢复数据时,默认情况下会将数据恢复到gpbackup备份的数据库中,如果该数据库已经不存在了,需要通过指定 --create-db 参数来自动创建数据库;如果数据库存在但是模式不存在,也会自动创建模式,如果模式已经存在,则会告警提示并继续恢复数据;如果数据库中同名的表已经存在,则恢复会失败并立刻停止。
接下来首先还是我们通过命令行来看一下gprestore命令自带的帮助信息有哪些参数,具体含义直接在参数后面进行翻译:
[chris@gpt1 ~]$ gprestore --help
gprestore is the parallel restore utility for Greenplum
Usage:
gprestore [flags]
Flags:
--backup-dir string `可选参数`, 写入备份文件的绝对路径,不能采用相对路径,如果您指定了该路径,恢复操作会在所有机器上的这个目录下查找备份文件(包括元数据文件)。如果您不指定这个选项,元数据文件会从Master节点的 `$MASTER_DATA_DIRECTORY/backups/YYYYMMDD/YYYYMMDDhhmmss/` 目录下查找,数据文件会从segment主机的 `<seg_dir>/backups/YYYYMMDD/ YYYYMMDDhhmmss/`目录下查找。该选项不能与 `--plugin-config` 选项共同使用。
--copy-queue-size int `可选参数`, 自行编译最新版本gpbackup带有的参数,该参数只能配合 `--single-data-file` 参数一起使用,当定义了 `--single-data-file` 参数以后,通过执行 `--copy-queue-size` 参数的值来指定gprestore命令使用COPY命令的个数,默认值为1。
--create-db `可选参数`, 在执行数据库对象(metadata)恢复之前先创建数据库,该操作实际上通过复制标准模版数据库template0来实现;如果不指定该参数,默认不会创建数据库,此时就要求该数据库必须存在,否则恢复失败。
--data-only `可选参数`, 仅恢复数据,不恢复表结构信息,这就要求要恢复的表必须已经在数据库中存在。需要特别注意的是,该表上SEQUENCE的值会被恢复成备份时的状态。
--debug `可选参数`, 打印详细的调试信息。
--exclude-schema stringArray `可选参数`, 指定恢复操作要排除的数据库模式(schema), 如果要排除多个模式,需要多次定义,不支持 `--exclude-schema=schema1,schema2` 的方式。另外该参数与 '--exclude-schema-file, exclude-table, --exclude-table-file, --include-schema, --include-schema-file, --include-table, --include-table-file' 这几个参数不能同时使用。
--exclude-schema-file string `可选参数`, 包含恢复操作要排除的数据库模式的文件,每一行为一个模式名,该文件不能包含多余的符号,如果数据库中的模式包含除了:字母、数字和下划线以外的特殊符号,那么请在文件中用双引号进行包裹。该参数与 '--exclude-schema, --exclude-table, --exclude-table-file, --include-schema, --include-schema-file, --include-table, --include-table-file' 这几个参数不能同时使用。
--exclude-table stringArray `可选参数`, 指定恢复操作中要排除的表名,该参数与 '--exclude-schema, --exclude-schema-file, --exclude-table-file, --include-schema, --include-schema-file, --include-table, --include-table-file' 这几个参数不能同时使用。指定表名时,必须使用 `<schema-name>.<table-name>` 的格式指定匹配到具体的模式,如果数据库中的模式包含除了:字母、数字和下划线以外的特殊符号,那么请在文件中用双引号进行包裹。另外该参数也支持多次指定。
--exclude-table-file string `可选参数`, 指定文件包含恢复操作中要排除的表名,该参数与 '--exclude-schema, --exclude-schema-file, --exclude-table, --include-schema, --include-schema-file, --include-table, --include-table-file' 这几个参数不能同时使用。指定表名时,必须使用 `<schema-name>.<table-name>` 的格式指定匹配到具体的模式,如果数据库中的模式包含除了:字母、数字和下划线以外的特殊符号,那么请在文件中用双引号进行包裹。如果有多个表,需要在文件中分行多次指定。
--help 显示命令行参数帮助信息,与具体的恢复操作无关。
--include-schema stringArray `可选参数`, 指定恢复操作要包含的数据库模式(schema), 如果要包含多个模式,需要多次定义,不支持 `--include-schema=schema1,schema2` 的方式。另外该参数与 '--exclude-schema, --exclude-schema-file, exclude-table, --exclude-table-file, --include-schema-file, --include-table, --include-table-file' 这几个参数不能同时使用。
--include-schema-file string `可选参数`, 包含恢复操作要包含的数据库模式的文件,每一行为一个模式名,该文件不能包含多余的符号,如果数据库中的模式包含除了:字母、数字和下划线以外的特殊符号,那么请在文件中用双引号进行包裹。该参数与 '--exclude-schema, --exclude-schema-file, --exclude-table, --exclude-table-file, --include-schema, --include-table, --include-table-file' 这几个参数不能同时使用。
--include-table stringArray `可选参数`, 指定恢复操作中要包含的表名,该参数与 '--exclude-schema, --exclude-schema-file, --exclude-table, --exclude-table-file, --include-schema, --include-schema-file, --include-table-file' 这几个参数不能同时使用。指定表名时,必须使用 `<schema-name>.<table-name>` 的格式指定匹配到具体的模式,如果数据库中的模式包含除了:字母、数字和下划线以外的特殊符号,那么请在文件中用双引号进行包裹。另外该参数也支持多次指定。
--include-table-file string `可选参数`, 指定文件包含恢复操作中要包含的表名,该参数与 '--exclude-schema, --exclude-schema-file, --exclude-table, --exclude-table-file, --include-schema, --include-schema-file, --include-table' 这几个参数不能同时使用。指定表名时,必须使用 `<schema-name>.<table-name>` 的格式指定匹配到具体的模式,如果数据库中的模式包含除了:字母、数字和下划线以外的特殊符号,那么请在文件中用双引号进行包裹。如果有多个表,需要在文件中分行多次指定。
--incremental `可选参数`, `测试功能`: 该选项与 '--data-only' 必须一起使用,仅恢复 '--timestamp' 参数指定的时间戳备份的数据,不恢复之前的全量和增量备份。该功能只对AO表有效,恢复的数据包括Heap表全量数据、最新修改备份的AO表增量数据、最新修改备份的叶子分区增量数据。
--jobs int `可选参数`, 指定进行表恢复过程中的并行任务数,如果不指定,该值默认为1,gprestore会使用一个任务(即一个数据库连接)进行备份。可以通过增加该值来提升备份速度,如果指定了大于1的值,备份操作会以表为单位进行并发操作,每个表开启一个单独的事务。需要特别注意的是,指定该参数进行并发备份时,不要进行外部程序操作,否则无法保证多表之间的事物一致性。该参数与 `-- single-data-file` 参数共同使用时,只能设置为1。
--metadata-only `可选参数`, 只恢复数据库的模式信息,该操作假设数据库中不存在要恢复的表。可以同时配合 '--with- global' 参数恢复数据库全局对象。如果后期想恢复数据,可以配合 '--data-only' 参数一起使用。
--on-error-continue `可选参数`, 指定该参数可以在出现恢复错误时,让恢复操作继续。默认情况下出错后马上退出恢复。在该操作模式下,错误信息会记录到备份目录的对应文件下,元数据恢复错误记录到日志文件 'gprestore_<backup-timestamp>_<restore- time>_error_tables_metadata' 中,生产数据恢复错误记录到日志文件 'gprestore_<backup-timestamp>_<restore- time>_error_tables_data' 中。
--plugin-config string `可选参数`, 指定plugin配置文件位置,该文件是一个有效的YAML文件,用来指定在恢复过程中使用的plugin应用的配置信息。该参数通常对应gpbackup使用该参数的场景,从一些非本地存储设备上进行恢复。
--quiet `可选参数`, 静默模式,除了warning和error信息都不打印。
--redirect-db string `可选参数`, 将数据恢复到指定的数据库,而不是恢复到原来备份的数据库中。
--redirect-schema string `可选参数`, 恢复数据到指定模式,而不是恢复到原来备份的模式中。即使原来的数据来自多个模式的多个表,也可以同时恢复到指定的模式和表中。这个参数必须与参数 '--include-table-file, --include-schema, 或 --include-schema- file' 一起使用以指定原来的表或者模式名称,当然这也决定了我们不能将它与参数 '-- exclude-schema 或 --exclude-table' 同时使用。该参数还可以配合 '--metadata-only 或 --data-only' 来恢复元数据或生产数据。
--run-analyze `可选参数`, 在运行完表数据恢复后,执行 'ANALYZE' 操作,该参数不能与 '--with-stats' 参数同时使用;默认情况下,针对分区表,会ANALYZE根分区,如果您指定了 '--leaf-partition-data' 则只会去ANALYZE对应恢复了数据的子分区。
--timestamp string `必选参数`, 指定要恢复的备份集的时间戳,格式为:'YYYYMMDDHHMMSS'。
--truncate-table `必选参数`, 在恢复之前先把目标表清空,该参数主要为了避免数据重复问题。
--verbose `可选参数`, 打印详细日志信息。
--version 打印gpbackup的版本号并退出。
--with-globals `可选参数`, 恢复全局对象。
--with-stats `可选参数`, 恢复查询计划统计信息。
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
- 12.
- 13.
- 14.
- 15.
- 16.
- 17.
- 18.
- 19.
- 20.
- 21.
- 22.
- 23.
- 24.
- 25.
- 26.
- 27.
- 28.
- 29.
- 30.
- 31.
- 32.
- 33.
- 34.
- 35.
- 36.
2
gprestore恢复实验及总结
在上面一部分,进行了详细的参数解释,下面我们通过一系列的实验来对一些特别的参数和场景进行演示。因为参数过多,不能一一列举,所以尽可能选用一些大家常用的场景,场景之间可能存在顺序关联关系,还请各位依次阅读。
本文所有实验都指定恢复目录: --backup-dir=/data/backups/,后面就不做赘述了。
2.1
常规恢复,只指定--timestamp参数
通过该试验让大家认识gprestore恢复操作都做了啥,方便大家对备份有一个整体的了解。
实验语句:
首先我们构造一个带有全量备份的增量备份:
然后,我们来直接指定增量备份时间戳,进行恢复:
大家是否从上面的恢复日志中发现了错误?因为我们的表备份完之后,仍然存在,所以默认情况下对象存在会报错退出。那么我们如果要让恢复操作成功,就需要把所有的表删除,我这里索性删掉整个库然后重建。
接下来我们登上数据库看一下模式和数据,应该全部恢复了:
实验总结:
如果要进行数据恢复,请指定备份数据集的时间戳,这些时间戳可以从备份目录的文件夹目录名称获取,只指定一个时间戳时,如果无论您指定的是全量备份还是增量备份的时间戳,都能正常恢复,指定全量备份时,只恢复全量部分;指定增量备份时间戳时,会恢复改增量及其以前的增量和全量数据。
2.2
指定--create-db参数,自动创建数据库
实验语句:
使用该参数,能够自动创建原来备份的数据库,所以我们先把数据库删掉再执行恢复,大家可以从以下日志中查看成功恢复的详细日志:
实验总结:
--create-db 参数可以帮助我们自动创建数据库,所以我们如果想做全库恢复并且担心数据重复,最好把数据库整个删掉然后直接用该参数执行恢复,这样最省事了。
2.3
指定--truncate-table参数,恢复前把表清空
由于--truncate-table参数是用来清空表的,也就是说表必须是存在的,如果表必须存在,那我们就不需要再恢复metadata表结构,此时也就要求我们在使用--truncate-table时必须配合--data-only一起使用,否则会报错,下面的实验语句,我做了三次,分别实验了:
- 只带有 --truncate-table 参数;
- --truncate-table 参数和 --data-only 参数配合使用;
- --truncate-table 参数和第一个小实验中提示的 --include-table or --include-table-file 参数配合使用(实验报错),因为使用了 --include-table or --include-table-file 参数时,必须配合 --data-only 参数一起使用。
实验语句:
实验总结:
--truncate-table 参数只有和 --data-only 参数一起使用时才会有效,主要是为了防止数据恢复时存在重复的问题。
2.4
指定--redirect-schema参数,恢复到指定的模式
细心的读者应该发现上面我其实已经创建了s1这个空模式,下面我们把public模式下的表恢复到s1模式试一下:
实验语句:
实验总结:
该实验展示了如何将public模式下的所有表恢复到s1模式下。您也可以将不同模式下的两个表的数据恢复到另外一个模式下的同一个表,但是这要求我们配合如下参数一起使用:--redirect-schema=s2 --include-table=public.tao --include-table=s1.tao --data-only 。
2.5
指定--on-error-continue参数,遇到问题并继续
该参数表示遇到问题时继续,我们在这里通过删除t1表来构造一个可继续执行的场景。实际生产上这个参数要慎用。
实验语句:
实验总结:
从上面的实验可以看出,我先把t1删掉了,然后查了一下t2有800条数据;执行完恢复后,发现t1表恢复了,t2表的数据也增加了(发生了数据重复场景)。在恢复过程中,错误信息都记录到了下面的日志文件中:
出错的表信息还可以从日志文件:
/home/chris/gpAdminLogs/gprestore_20220402.log 中查询。个人感觉这个参数还是要慎用,使用场景有限,在特别熟悉参数的前提下,可以配合一些其他的参数共同使用,特别要注意避免数据重复恢复问题。
2.6
指定--redirect-db参数,恢复到特定数据库
--redirect-db 参数可以将gpbackup原来备份的数据库数据恢复到新的数据库中,该参数指定的数据库可以存在也可以不存在,如果数据库不存在,就必须配合 --create-db 参数一起使用。下面我分别执行一下新数据库不存在和存在两种场景:
实验语句:
实验总结:
在一些实验环境下,可以通过该参数从备份快速创建测试数据库,而不必担心对原来的数据库产生什么影响。如果目标数据库不存在,可以配合 --create-db 参数自动创建数据库。
3
备份恢复操作的状态码
为了方便大家在程序中调用gpbackup/gprestore命令后进行成功与否的判断,两个命令执行完成后,均会返回状态码,状态码几其代表的意义如下:
- 0 - 备份/恢复成功,没有错误
- 1 - 备份/恢复成功,没有fatal错误
- 2 - 备份/恢复失败,带有fatal错误
4
邮件告警配置
gpbackup和gprestore操作完成后,可以进行邮件告警,如果您想使用该功能,那就需要提前在$HOME目录或$GPHOME/bin/目录下创建好发送邮件用的服务器信息配置,如果二者都做了配置,那会以$HOME目录下的文件为准。下面我们进行演示。
4.1
编写配置文件 gp_email_contacts.yaml
文件格式如下,在创建YAML的时候,要保证YAML的格式正确:
4.2
实验邮件发送功能
这里就不贴操作步骤了,直接放一张邮件截图,我这里给放到垃圾邮件了,请多多测试并添加到新人列表中。

文章转载自公众号:Greenplum中文社区