【我和openGauss的故事】使用Ora2Pg迁移oracle数据到openGauss

老老老JR老北
发布于 2023-9-8 14:56
浏览
0收藏

前言

本博客介绍了使用Ora2Pg迁移oracle数据到openGauss


1、下载及安装Ora2Pg

1.1、下载说明:

Perl DBD: http://search.CPAN.org      #只需在搜索输入框中输入模块的全名(例如:DBD::Oracle、DBD::Pg)
Ora2Pg:https://ora2pg.darold.net/start.html

在Windows下,应该安装Strawberry Perl(http://strawberryperl.com)和操作系统对应的Oracle客户机。
在Windows上从CPAN编译DBD::Oracle似乎是一件很困难的事情,而且关于这方面的文档很少(大部分都过时了,不能工作)。
安装ActiveState Perl的免费版本(http://www.ActiveState.com/activeperl)可能会有所帮助,因为它们似乎已经打包好了DBD::Oracle,易于安装。

必须在系统上安装 Oracle Instant Client 或完整的 Oracle 安装。您可以从 Oracle 下载中心下载 RPM:
rpm -ivh oracle-instantclient12.2-basic-12.2.0.1.0-1.x86_64.rpm
rpm -ivh oracle-instantclient12.2-devel-12.2.0.1.0-1.x86_64.rpm
rpm -ivh oracle-instantclient12.2-jdbc-12.2.0.1.0-1.x86_64.rpm
rpm -ivh oracle-instantclient12.2-sqlplus-12.2.0.1.0-1.x86_64.rpm
或者只需从 Oracle 下载中心下载相应的 ZIP 存档并将它们安装在您想要的位置,例如:/opt/oracle/instantclient_12_2/

需要一个现代的Perl发行版(perl 5.10及更高版本)。要连接到数据库并继续迁移,您需要 DBI Perl 模块> 1.614。
要迁移 Oracle 数据库,您需要安装 DBD::Oracle Perl 模块。
要迁移MySQL数据库,您需要DBD::MySQL Perl模块。
这些模块用于连接到数据库,但如果要迁移 DDL 输入文件,则它们不是必需的。

默认情况下,Ora2Pg 将导出转储到平面文件,要将它们加载到 PostgreSQL 数据库中,您需要 PostgreSQL 客户端(plsql)。
如果在运行 Ora2Pg 的主机上没有该文件,则始终可以将这些文件传输到安装了 psql 客户端的主机上。
如果你更喜欢“动态”加载导出,则需要perl模块DBD::Pg。
Ora2Pg 允许您将所有输出转储到压缩的 gzip 文件中,为此您需要 Compress::Zlib Perl 模块。
如果您更喜欢使用 bzip2 压缩,则程序 bzip2 必须在您的 PATH

1.2、安装说明:

执行以下命令安装:
-------------------------------
yum -y install perl perl-CPAN gcc perf cpan


安装ora2pg:
-------------------------------
tar xjf ora2pg-x.x.tar.bz2
cd ora2pg-x.x/
perl Makefile.PL
make && make installPS:这将把Ora2Pg.pm安装到站点Perl存储库中,Ora2Pg安装到/usr/local/bin/中,Ora2Pg.conf安装到/etc/Ora2Pg/中。

1.3、安装ora2pg到其他目录

-------------------------------
tar xjf ora2pg-x.x.tar.bz2
cd ora2pg-x.x/
perl Makefile.PL PREFIX=<your_install_dir>
make && make install
export PERL5LIB=<your_install_dir>
ora2pg -c config/ora2pg.conf -t TABLE -b outdir/

1.4、安装DBD::Oracle

-------------------------------
将ORACLE_HOME和LD_LIBRARY_PATH环境变量设置为 root 用户后,安装 DBD::Oracle
进入:http://search.CPAN.org/ 搜索DBD::Oracle,下载;

修改root用户的环境变量:
-------------------------------
vi .bash_profile
export LD_LIBRARY_PATH=/oracle/app/oracle/product/11.2.0/db_1/lib
export ORACLE_HOME=/oracle/app/oracle/product/11.2.0/db_1
export PATH=/oracle/app/oracle/product/11.2.0/db_1/bin:$PATH

source /root/.bash_profile
tar -zxvf DBD-Oracle-1.80.tar.gz

cd DBD-Oracle-1.80
perl Makefile.PL
make
make install

1.5、错误信息参考:

1.5.1、错误提示:

-------------------------------
[root@luozhonghua FCGI-0.71]# perl Makefile.PL

can't locate ExtUtils/MakeMaker.pm in @INC (@INC contains: /usr/local/lib/perl5 /usr/local/share/perl5
/usr/lib/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib/perl5 /usr/share/perl5 .) at Makefile.PL line 3.
BEGIN failed--compilation aborted at Makefile.PL line 3.

解决方法:
-------------------------------
这句显示ExtUtils/MakeMaker.pm没有安装,
执行以下命令安装:
yum -y install perl perl-CPAN gcc
1.5.2、错误提示:

-------------------------------
[root@oracle DBD-Oracle-1.80]# perl Makefile.PL
Can't locate DBI.pm in @INC (@INC contains: /usr/local/lib64/perl5 /usr/local/share/perl
5 /usr/lib64/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib64/perl5 /usr/share/perl5 .)
at Makefile.PL line 20.BEGIN failed--compilation aborted at Makefile.PL line 20.

解决方法:
-------------------------------
安装DBI-1.643 进入:http://search.CPAN.org/ 搜索dbi,下载;
tar -zxvf DBI-1.643.tar.gz
cd DBI-1.643
perl Makefile.PL
make && make install

2、使用Ora2Pg生成迁移模板

2.1、使用ora2pg初始化一个项目模板

-------------------------------
ora2pg --project_base /ora2pg --init_project test_project
-------------------------------
Creating project test_project.
/app/migration/test_project/
schema/
dblinks/
directories/
functions/
grants/
mviews/
packages/
partitions/
procedures/
sequences/
synonyms/
tables/
tablespaces/
triggers/
types/
views/
sources/
functions/
mviews/
packages/
partitions/
procedures/
triggers/
types/
views/
data/
config/
reports/
Generating generic configuration file
Creating script export_schema.sh to automate all exports.
Creating script import_all.sh to automate all imports.


示例生成了一个通用的配置文件,只需要在其中指定 Oracle 数据库连接信息;
同时还生成了一个脚本文件 export_schema.sh。
目录 sources/ 包含 Oracle 代码
目录 schema/ 包含移植到 PostgreSQL 的代码
目录 reports/ 包含带有迁移成本评估的 html 报告

如果要使用自己的默认配置文件,请使用-c选项指定该文件的路径。

设置与 Oracle 数据库的连接后,可以执行脚本export_schema.sh 该脚本将从 Oracle 数据库导出所有对象类型,并将 DDL 文件输出到架构的子目录中。
在导出结束时,它将在稍后完成并验证架构导入时为您提供导出数据的命令。
您可以选择加载手动生成的 DDL

2.2、通过更新oracle上的统计信息,可能提高性能:

BEGIN
DBMS_STATS.GATHER_SCHEMA_STATS
DBMS_STATS.GATHER_DATABASE_STATS
DBMS_STATS.GATHER_DICTIONARY_STATS
END;

2.3、修改ora2pg.conf参考:

ORACLE_HOME /u02/app/oracle/product/11.2.4/db1
ORACLE_DSN dbi:Oracle:host=192.168.56.2;sid=orcl;port=1521;
ORACLE_USER system
ORACLE_PWD system_123456
SCHEMA liuzitao #需要导出的业务用户名称
USER_GRANTS 0 #ORACLE_USER 有DBA权限设置为0,否则1
DEBUG 0
ORA_INITIAL_COMMAND
EXPORT_SCHEMA 0
CREATE_SCHEMA 1
COMPILE_SCHEMA 0
TYPE TABLE
OUTPUT output.sql

2.4、Oracle相关参数:

ORACLE_HOME
用于将环境变量设置为DBD::Oracle Perl模块所需的Oracle库ORACLE_HOME。
-------------------------------
ORACLE_DSN
此指令用于以标准 DBI DSN 的形式设置数据源名称。例如:
dbi:Oracle:host=oradb_host.myhost.com;sid=DB_SID;port=1521或
dbi:Oracle:DB_SID 在 18c 上,例如:
dbi:Oracle:host=192.168.1.29;service_name=pdb1;port=1521
对于第二种表示法,SID 应在已知文件 $ORACLE_HOME/network/admin/tnsnames.ora 或提供给 TNS_ADMIN 环境变量的路径中声明。
对于MySQL,DSN将像这样运行:
dbi:mysql:host=192.168.1.10;database=sakila;port=3306 "SID"部分替换为"数据库"。
-------------------------------
ORACLE_USER and ORACLE_PWD
这两个指令用于定义 Oracle 数据库连接的用户和密码。请注意,最好以 Oracle 超级管理员身份登录,以避免在数据库扫描期间出现授权问题,并确保没有遗漏任何内容。
如果您没有提供带有ORACLE_PWD的凭据,并且您已经安装了 Term::ReadKey Perl 模块,Ora2Pg 将以交互方式询问密码。如果未设置ORACLE_USER,也会以交互方式询问。
要连接到具有“sysdba”连接的本地 ORACLE 实例,您必须将ORACLE_USER设置为 "/" 并设置空密码。
-------------------------------
USER_GRANTS
如果以简单用户身份连接 Oracle 数据库并且没有足够的授权从 "DBA_" 中提取内容,请将此指令设置为 1。它将使用表 "ALL_" 相反。
警告:如果使用导出类型 GRANT,则必须将此配置选项设置为 0,否则它将不起作用。
-------------------------------
TRANSACTION
该选项用于修改数据导出事务的默认隔离级别。现在默认的设置是序列化事务隔离级别,用于保证导出数据的一致性。以下是一些支持的设置:
readonly: 'SET TRANSACTION READ ONLY',
readwrite: 'SET TRANSACTION READ WRITE',
serializable: 'SET TRANSACTION ISOLATION LEVEL SERIALIZABLE'
committed: 'SET TRANSACTION ISOLATION LEVEL READ COMMITTED',
6.2 版本之前的默认隔离级别为 READ ONLY,但是这种设置在某些情况下会破坏数据一致性,因此现在的默认设置为SERIALIZABLE。
-------------------------------
INPUT_FILE
该参数不是用于设置 Oracle 数据库连接,它指定了一个输入文件,并且禁用了 Oracle 数据库连接。
将该参数设置为一个包含了 Oracle PL/SQL 代码(例如函数、过程或者包)的文件,可以阻止 Ora2Pg 连接 Oracle 数据库,
而是从该文件 and just apply his conversion tool to the content of the file.
该选项可以用于大部分的导出类型:TABLE、TRIGGER、PROCEDURE、VIEW、FUNCTION 或者 PACKAGE等。
-------------------------------
ORA_INITIAL_COMMAND
该选项用于建立 Oracle 数据库连接后,执行一个初始化命令。例如在读取对象信息之前关闭访问限制策略,或者设置某些会话参数。该选项支持多次设置。
-------------------------------
LOGFILE
默认情况下,所有的消息都会发送到标准输出。如果为该选项指定一个文件路径,所有的输出信息将会追加到该文件中。
-------------------------------
ORACLE_COPIES
此配置指令增加了多进程支持,以从 Oracle 提取数据。该值是用于并行化选择查询的进程数。默认值为禁用并行查询。
并行性建立在将作为值给出的内核数的查询拆分为ORACLE_COPIES,如下所示:
SELECT * FROM MYTABLE WHERE ABS(MOD(COLUMN, ORACLE_COPIES)) = CUR_PROC
其中 COLUMN 是一个技术键,类似于主键或唯一键,其中拆分将基于该键以及查询使用的当前核心 (CUR_PROC)。
在Windows操作系统下不起作用,它只是被禁用。
-------------------------------
DEFINED_PK
此指令用于定义技术密钥,用于在使用ORACLE_COPIES变量设置的内核数之间拆分查询。例如:
DEFINED_PK EMPLOYEES:employee_id
假设 -J 或 ORACLE_COPIES 设置为 8 将使用的并行查询:
SELECT * FROM EMPLOYEES WHERE ABS(MOD(employee_id, 8)) = N
其中 N 是从 0 开始分叉的当前进程。
-------------------------------
PARALLEL_TABLES
此指令用于定义将并行处理以进行数据提取的表数。限制是计算机上的核心数。
Ora2Pg 将为每个并行表提取打开一个数据库连接。
当此指令大于 1 时,将使 ORACLE_COPIES 无效,但不会使 JOBS 无效,因此将使用的实际进程数为 PARALLEL_TABLES * JOBS。
请注意,如果要导出到文件,此指令在设置为 1 以上时也将自动启用 FILE_PER_TABLE 指令。这用于将表和视图导出到单独的文件中。
-------------------------------
DEFAULT_PARALLELISM_DEGREE
您可以通过为此指令设置一个大于 2 的值,强制 Ora1Pg 在用于从 Oracle 导出数据的每个查询中使用 /*+ PARALLEL(tbname, degree) */ 提示。
值为 0 或 1 将禁用并行提示。默认值已禁用。
-------------------------------

2.5、Oracle 数据加密传输:

如果 Oracle 客户端配置了加密连接,DBD:Oracle 也会使用该加密方式进行连接和数据传输。
例如,将以下内容添加到 Oracle 客户端配置文件(sqlnet.ora 或 .sqlnet):

cat sqlnet.ora
-------------------------------
# Configure encryption of connections to Oracle
SQLNET.ENCRYPTION_CLIENT = required
SQLNET.ENCRYPTION_TYPES_CLIENT = (AES256, RC4_256)
SQLNET.CRYPTO_SEED = 'should be 10-70 random characters'

如果设置了上述加密传输,任何使用 Oracle 客户端连接到数据库的工具都会使用这种加密方式。

例如,Perl 的 DBI 模块通过DBD-Oracle 连接 Oracle 数据库,后者使用 Oracle 客户端连接数据库。
如果 Oracle 客户端配置了加密连接,Perl 同样使用加密的方式连接 Oracle 数据库。

2.6、Oracle相关参数:

ORACLE_HOME /u01/app/oracle/product/11.2.0/
ORACLE_DSN dbi:Oracle:host=oracleIP;sid=orcl;port=1521
ORACLE_USER customerchat // 这里用的oracle普通用户和密码
ORACLE_PWD XXXXX
SCHEMA customerchat //一般和用户名一样

2.7、openGauss相关参数:

PG_DSN dbi:Pg:dbname=mydb;host=localhost;port=5432
PG_USER tuser
PG_PWD 自己定义的密码

2.8、工具自身参数:

DATA_LIMIT 默认是10000,如果oracle服务器内存较小,比如4G以下,可以修改为2500或5000,否则可能会报内存不足。

2.9、连接测试:

设置好 Oracle 数据库的 DSN 之后,可以执行以下命令测试数据库的连接:
-------------------------------
ora2pg -t SHOW_VERSION -c config/ora2pg.conf
-------------------------------
以上命令将会显示 Oracle 数据库的版本。

2.10、测试迁移:

修改 export_schema.sh 中导出类型 EXPORT_TYPE 和 SOURCE_TYPE ,本次迁移导出 TABLE 。
-------------------------------
sh export_schema.sh
-------------------------------
执行完成后 在schema/tables生成 table.sql ,里面是建表脚本。reports/目录下生成的report报告report.html


导出COPY数据:
-------------------------------
ora2pg -t COPY -o data.sql -b ./data -c ./config/ora2pg.conf

2.11、导入:

为了使用openGauss命令行工具gsql,需要将数据库的bin和lib加在操作系统的环境变量PATH和LD_LIBRARY_PATH中。
-------------------------------
将 import_all.sh 里的 psql 修改为 gsql
-------------------------------


执行导入脚本,表示使用用户tuser登录openGauss中mydb的数据库,ip和端口,-f选项表示跳过用户和数据库是否需要创建的检查。
-------------------------------
sh import_all.sh -d mydb -o tuser -h openGaussIP -p 5432 -f

2.12、ora2pg只导入元数据:

./import_all.sh -a -d liuzitao -o liuzitao -p 5432
./import_all.sh -a -d liuzitao -h 127.0.0.1 -o linl -n linl -p 5432
./import_all.sh -a -h 127.0.0.1 -d liuzitao -o linl -p 5432

2.13、错误信息:

1.报错:Path to pg_config? /opt/software/openGauss/bin/pg_config/opt/software/openGauss/bin/pg_config:
error while loading shared libraries: libssl.so.1.1: cannot open shared object file: No such file or directory
环境自带的是1.0.2,得升级libssl.so。

openssl version -a
-------------------------------
OpenSSL 1.0.2k-fips 26 Jan 2017
yum remove openssl

获取新的版本并安装:
-------------------------------
wget https://www.openssl.org/source/openssl-1.1.1c.tar.gz
tar -zxvf openssl-1.1.1c.tar.gz
cd openssl-1.1.1c
./config --prefix=/usr/local/openssl #如果此步骤报错,需要安装perl以及gcc包
make && make install
-------------------------------
ln -s /usr/local/openssl/lib/libssl.so.1.1 /usr/lib64/libssl.so.1.1
ln -s /usr/local/openssl/lib/libcrypto.so.1.1 /usr/lib64/libcrypto.so.1.1
ln -s /usr/local/openssl/bin/openssl /usr/bin/openssl
ln -s /usr/local/openssl/include/openssl /usr/include/openssl
echo "/usr/local/openssl/lib" >> /etc/ld.so.conf
ldconfig -v

sudo yum install postgresql-devel

再重新执行 perl -MCPAN -e 'install DBD::Pg'


-------------------------------
2、perl 报错 Can’t locate JSON.pm in @INC
解决:
sudo perl -MCPAN -e 'install JSON'

-------------------------------
3、执行sh import_all.sh -d mydb -o tuser -h IP -p 5432 -f 提示Out of memory , 但是top显示还有1G多。
解决办法:
Opened ./config/ora2pg.conf and modfied set DATA_LIMIT 5000 or 2500 solved the issue.

-------------------------------
4、报错:DBD::Pg::db do failed: ERROR: permission denied for relation xxx
解决办法:
需要给openGauss的角色赋权限
mydb=# grant all privileges to tuser;

-------------------------------
5、报错:DBI connect('dbname=mydb;host=openGaussIP;port=5432','testuser',…) failed: connection to server at “openGaussIP”,
port 5432 failed: none of the server’s SASL authentication mechanisms are supported at /opt/software/ora2pg/lib
解决办法:
这个错是openGauss返回的。需要修改 openGauss 的 pg_hba.conf 和 postgres.conf:
修改 data/single_node/postgresql.conf 中 password_encryption_type = 1 。修改pg_hba.conf;

然后重启openGauss:
-------------------------------
gs_ctl restart -D /opt/software/openGauss/data/single_node





文章转载自公众号:openGauss

       

分类
标签
已于2023-9-8 14:56:40修改
收藏
回复
举报
回复
    相关推荐