项目需求

据称现有环境为多节点RAC,管理成本高,主要体现在没有专业技术人家对基础设施进行维护。迁移到云上以后,基础设施维护就节省掉了。而且后边容量扩充易如反掌,远程维护之类也比物理环境去现场操作方便许多。

但在云上,oracle RAC实现的两个前提条件--共享存储及心跳网络,不被正式支持,因此要在云上部署oracle RAC用于生产环境,不是一个好的解决方案。经过多轮讨论,一致同意在百度云部署单实例oracle 12c,以dataguard方式来保护数据可用性。

当然,相对与RAC,单实例的系统负载能力要差很多;同样是两个节点,RAC两节点是同时对外提供读写服务,而单实例dataguard,只有一台设备对外提供服务,而另一台只能做备用,与主库进行数据同步而已。考虑到实际业务访问量不大的情况,这样做也在可接受范围。

 

基础设施

两台云主机,临时绑定公网ip,20M独享带宽。

资源配置为:cpu 8core,内存32G,系统盘50G,云盘1000G。

云主机默认没有swap,因此用这1000G云盘的部分做swap,其余用于安装目录及数据目录。

操作系统版本已经有别人选好,版本为CentOS release 6.8,我没有自主权,不然就选centos 7。不过6也好,关防火墙没centos 7那么繁琐。

曾经在阿里云部署了几套oracle 11g,用的centos 7,在执行正式安装指令./runInstaller 时,多要一步操作,即以oracle帐号帐号执行 export DISPLAY=:1,不然无法进行下一步。具体参考我以前的文章“阿里云部署oracle 11g”,连接地址为sery/2107701 。

软件使用oracle 12c,有正式授权,让我自己去官网下载。这还真费事,先下载到自己的个人电脑(不能直接用wget,需要输入用户名及密码验证—也许我不懂怎么在命令行拼接这个下载的url),再上传到云主机。接近4G的文件,下载、上传花了太多时间,唉!

 

oracle安装前的准备

主要步骤有:准备交换分区及数据分区、修改主机名、修改系统相关配置及依赖包、准备桌面环境。

◎准备准备交换分区及数据分区

◆准备交换分区

fdisk /dev/vdb

mkswap /dev/vdb1

swapon /dev/vdb1

Fdisk操作过程中,分区代码选“82”,大小为18G。执行完上述操作后,用命令free –m检查是否生效。

由上图可知,交换分区确实被加载到系统。为了让交换分区随系统开机加载,需要修改文件/etc/fstab,加入的内容等描述完加数据分区以后,一并贴出。

◆准备数据分区

fdisk /dev/vdb

mkfs.ext4 /dev/vdb2

mkdir /u01

mount /dev/vdb2 /u01

为使挂接永久生效,需要对文件/etc/fstab做修改,加入交换分区及数据分区以后,/etc/fstab文件的内容如下所示:

修改完以后,重启一下系统,用df –h 及 free –m 执行一下,看是否自动挂载交换分区及数据分区。

 

◎修改主机名

云服务器的主机名,总是莫名其妙,看起来很是不爽。改主机名,有两个目的,一个是登录系统便于辨识,另外一个原因是服务器之间通讯用短词比ip地址省事。需要注意的是,操作系统版本不一样,修改主机名的方式也可能不同。比如centos 7,就有一个/etc/hostname文件来关联。对于centos 6及以前版本,与主机名有关系的文件大概有:/etc/sysconfig/network,/etc/sysconfig/network-scriptes/ifcfg-eth0,/etc/hosts。有时候出问题,很可能就在这些文件里主机名的设定,建议挨个检查。下面只列出两个云主机的/etc/hosts内容:

[root@oradb162 ~]# more   /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4   localhost4.localdomain4

::1         localhost localhost.localdomain   localhost6 localhost6.localdomain6

#192.168.0.4 instance-umns7cw3-2   instance-umns7cw3-2.novalocal

192.168.0.4   oradb162

192.168.0.5   oradb95

[root@oradb95 ~]# more   /etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4   localhost4.localdomain4

::1         localhost localhost.localdomain   localhost6 localhost6.localdomain6

192.168.0.5 oradb95 oradb95.novalocal

192.168.0.4 oradb162


改完后,如果执行hostname没见效果,再检查一遍与主机名相关文件的设置,然后重启系统试试。主机名生效后,用设定的名称代替ip地址,两机互ping测试网络连通性。

 

◎准备桌面环境

大部分情况下,我都用远程桌面方式安装oracle,这有助于把控整个安装过程,直观了解安装进展及发生的问题。桌面环境由xwindow及vncserver组成,默认情况下,云主机是没有安装这两个工具。多次实践证明,vncserve配合xwindow为最佳组合,安装完就能用,不蓝屏或灰屏。具体的安装步骤如下:

yum groupinstall "X   Window System" "Desktop" -y

yum install tigervnc-server   -y

安装完这两个工具以后,只需要启动vncserver,设置好用户名和密码,注意输出,用客户端连接的时候需要使用。

连接成功以后,没有黑屏灰屏,恭喜!

 

◎修改系统相关配置及依赖包

步骤比较繁杂,因为经常要安装部署oracle,我就写了一个脚本,该脚本在11g及12c都有效,其内容为:

[root@oradb95 ~]# more oracle_rep.bash

#!/bin/bash

#writed by sery 2012-05-16

 

#########################################

#install depending packages                       #

#########################################

yum install gcc* gcc-* gcc-c++-*   glibc-devel-* glibc-headers-* compat-libstdc* \

libstdc* elfutils-libelf-devel*   libaio-devel* \

sysstat* unixODBC-* pdksh-* ksh   compat-libcap1

########################################

#add groups,user and create dir        #

########################################

/usr/sbin/groupadd -g 501 oinstall

/usr/sbin/groupadd -g 502 dba

useradd -u 1000 -g oinstall -G dba   oracle

 

mkdir /u01/app/

mkdir -p /u01/app/oraInventory

mkdir -p /u01/app/oracle

chown -R oracle:oinstall /u01/app

chmod -R 775 /u01/app

 

##############################################

#modify    sysctl.conf                                    #

##############################################

cat >> /etc/sysctl.conf   <<done

fs.file-max = 6815744

kernel.shmall = 2097152

kernel.shmmni = 4096

kernel.sem = 250 32000 100 128

net.ipv4.ip_local_port_range = 9000   65500

net.core.rmem_default = 262144

net.core.rmem_max = 4194304

net.core.wmem_default = 262144

net.core.wmem_max = 1048576

fs.aio-max-nr = 1048576

done

 

sysctl -p

 

###############################################

#modify    /etc/security/limits.conf                          #

###############################################

cat >> /etc/security/limits.conf   << done

oracle soft nproc 2047

oracle hard nproc 16384

oracle soft nofile 1024

oracle hard nofile 65536

done

 

################################################

#modify /etc/pam.d/login                                  #

################################################

echo "session    required       pam_limits.so">>/etc/pam.d/login

 

################################################

# setting user oracle env                                   #

################################################

cat >> /home/oracle/.bash_profile   <<done

export ORACLE_SID=gbdb

export ORACLE_UNQNAME=oradb162

export ORACLE_base=/u01/app/oracle

export ORACLE_HOME=/u01/app/oracle/product/12.2.0

export PATH=$ORACLE_HOME/bin:$PATH

done


依赖包安装那步,可能有重复(安装xwindow桌面环境可能会顺带安装了一些依赖),不过如果已经安装过相关的包,执行过程会自动跳过,不会有任何风险存在。执行这个脚本,完事后检查一下相关目录是否生成,配置文件是否被修改。

 

正式安装oracle

用vnc客户端连接到云主机,进入系统桌面以后,至少开一个终端窗口,以root帐号执行指令“xhost +”,切换帐号到oracle ,指令为 “su – oracle”。再开一终端窗口,以root帐号把下载来的oracle解包,命令如下:

unzip   linuxx64_12201_database.zip

执行完毕,将在当前路径生成目录database,把此目录复制到/home/oracle,执行命令:

chown –R oracle:oinstall   /home/oracle/database

现在切换到oracle帐号那个终端窗口,执行“./runInstaller”,只要能出安装界面,一般都不会有问题。

往下进行的时候,选择只安装数据库软件,即第2个选项。再往下,会检查依赖包,交换分区等,如有问题,会有输出提示,按提示处理即可。安装软件所需要的时间,跟资源配置相关,资源越好(cpu、内存、硬盘)、速度越快,安装时间也就越短。

安装完软件,检查一下目录,看看/u01/app/oracle路径下,文件目录是否都生成了。12c正确安装以后,不需要执行netca来配置监听器,默认已经弄好了,直接以oracle帐号启动即可:

[oracle@oradb95 ~]$ su – oracle

[oracle@oradb95 ~]$ lsnrctl start

[oracle@oradb95 ~]$ lsnrctl status

LSNRCTL for Linux: Version 12.2.0.1.0 -   Production on 14-JUN-2018 14:47:13

 

Copyright (c) 1991, 2016, Oracle.  All rights reserved.

 

Connecting to (ADDRESS=(PROTOCOL=tcp)(HOST=)(PORT=1521))

STATUS of the LISTENER

------------------------

Alias                     LISTENER

Version                   TNSLSNR for Linux: Version   12.2.0.1.0 - Production

Start Date                14-JUN-2018 10:32:21

Uptime                    0 days 4 hr. 14 min. 52   sec

Trace Level               off

Security                  ON: Local OS Authentication

SNMP                      OFF

Listener Log File           /u01/app/oracle/diag/tnslsnr/oradb95/listener/alert/log.xml

Listening Endpoints Summary...

  (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=oradb95)(PORT=1521)))

The listener supports no services

The command completed successfully

上述操作在两个服务器都相同。

 

创建数据库(仅在主库操作)

继续在vnc客户端进行操作。终端窗口,以oracle帐号执行“dbca”,弹出图形操作界面,选择“Create a database(创建一个数据库)”。

下一步选“typical configuration”,字符集选GBK(这个是对方要求的,也可以创建完后再更改),密码设置设置建议不要用特殊字符,如“Sd4d@8_”这类的,在连接数据库的时候,会比较恼火!如果选择了“Advanced configuration(高级定制方式)”,就顺手把归档项给选上。由于是旧的项目迁移,没有选择12c的新特性“容器数据库”。内存管理,可工具自己系统资源的情况自行调整(拉滚动条即可)。

高级定制还可以把EM配置上,12c的em还是管理数据库还是很方便的,特别是扩充系统表空间(默认系统表空间、系统辅助白空间太小,不太适应真实应用)。

连续点几个“Next”,到汇总界面后,基本就没什么问题了。

如果对创建的数据库不满意,在没有正式导入数据投入生产以前,再用dbca进行删除即可。

数据库创建成功后,实例自动启动,可查看系统进程进行验证。更进一步,执行命令:

[root@oradb162 ~]# su   - oracle

[oracle@oradb162 ~]$ sqlplus / as sysdba;

 

SQL*Plus: Release 12.2.0.1.0 Production   on Fri Jun 15 10:35:53 2018

 

Copyright (c) 1982, 2016, Oracle.  All rights reserved.

 

 

Connected to:

Oracle Database 12c Enterprise Edition   Release 12.2.0.1.0 - 64bit Production

 

SQL> select   count(*) from v$session;

 

  COUNT(*)

----------

          46

如果得到如上的结果,可以认为一切正常。

前边我强调过,oracle 默认系统表空间太小,需要调整。有两种方法:一种是sqlplus客户端进去执行alter 语句,另一种是em浏览器方式。其实都是去操纵那个sql语句而已。下边以图形方式来演示这个更改过程,看起来更直观一些.

鼠标点左侧“+SYSTEM”,选中文件那行,如下图:

点菜单“操作”下拉列表框,选“调整大小”项,弹出具体的操作框,如下两图所示:

填写大小为2G,不急着确定,点“显示 SQL”,可得到实际sql语句如下:

ALTER DATABASE DATAFILE   '/u01/app/oracle/oradata/GBDB/datafile/o1_mf_system_fl1mqhrq_.dbf' RESIZE 2G;

瞧,是不是跟sqlplus敲代码的效果一样呢?默认是810M,现在点“确定”按钮是更改生效。到oracle数据库目录实际查看,看文件大小是否发生改变。

[oracle@oradb162 datafile]$ cd /u01/app/oracle/oradata/GBDB/datafile/

[oracle@oradb162 datafile]$ du -hs *

551M    o1_mf_sysaux_fl1msk5v_.dbf

2.1G      o1_mf_system_fl1mqhrq_.dbf

2.3M    o1_mf_temp_fl1mw9p0_.tmp

71M     o1_mf_undotbs1_fl1mtnct_.dbf

5.1M    o1_mf_users_fl1mtojb_.dbf

嘿嘿,没骗人呢,文件大小确实变化了。再用此方法,把辅助表空间调成1G的容量。

 

Datagurd实现过程

主备两机都需要操作,而且操作方法有差异,在描述中,我会特别标明,不至于让他人困惑。

两台服务器的监听器随oracle 12c的安装已经自动配置完成,默认监听并没有生成文件,需要手动或者执行netca去生成。

◆主库的监听文件内容为:

[oracle@oradb162 admin]$ pwd

/u01/app/oracle/product/12.2.0/network/admin

[oracle@oradb162 admin]$ more listener.ora

# listener.ora Network Configuration   File: /u01/app/oracle/product/12.2.0/network/admin/listener.ora

# Generated by Oracle configuration   tools.

 

LISTENER =

    (DESCRIPTION_LIST =

      (DESCRIPTION =

        (ADDRESS = (PROTOCOL = TCP)(HOST = oradb162)(PORT = 1521))

        (ADDRESS = (PROTOCOL = IPC)(KEY = EXTPROC1521))

      )

    )

 

SID_LIST_LISTENER=

    (SID_LIST =

      (SID_DESC =

        (GLOBAL_DBNAME = gbdb)

        (ORACLE_HOME =/u01/app/oracle/product/12.2.0)

        (SID_NAME = gbdb)

      )

     )

 

◆备库的监听文件内容为:

[oracle@oradb162 admin]$ pwd

/u01/app/oracle/product/12.2.0/network/admin

[oracle@oradb162 admin]$ more listener.ora

# listener.ora Network Configuration   File: /u01/app/oracle/product/12.2.0/network/admin/listener.ora

# Generated by Oracle configuration   tools.

 

LISTENER =

    (DESCRIPTION_LIST =

      (DESCRIPTION =

        (ADDRESS = (PROTOCOL = TCP)(HOST = oradb95)(PORT = 1521))

        (ADDRESS = (PROTOCOL = IPC)(KEY = EXTPROC1521))

      )

    )

 

SID_LIST_LISTENER=

    (SID_LIST =

      (SID_DESC =

        (GLOBAL_DBNAME = gbdb)

        (ORACLE_HOME =/u01/app/oracle/product/12.2.0)

        (SID_NAME = gbdb)

      )

     )


◎配置本地命名服务

两台服务器进行相同的操作。继续在vnc客户端,终端窗口以oracle帐号执行netca(开始用文本编辑器编写tnsname.ora文件,总是不行。比如第一行要定格,不要有空格等,书写要求太严。后用图形创建,创建完查看文件,即不出错,又了解实质)。鼠标选取第三项,如图所示:

选取“add”点“Next”按钮,“Service Name”填“gbdb”,接着点几次“Next”,到填“Host name”这里填写“oradb162(与/etc/hosts设定相一致)”,如下图所示:

配置完这个,再重复此操作,把oradb95给加上。执行完毕后,tnsname.ora的内容为:

[oracle@oradb95 admin]$ more tnsnames.ora

# tnsnames.ora Network Configuration   File: /u01/app/oracle/product/12.2.0/network/admin/tnsnames.ora

# Generated by Oracle configuration   tools.

 

ORADB162 =

    (DESCRIPTION =

      (ADDRESS_LIST =

        (ADDRESS = (PROTOCOL = TCP)(HOST = oradb162)(PORT = 1521))

      )

      (CONNECT_DATA =

        (SERVICE_NAME = gbdb)

      )

    )

 

ORADB95 =

    (DESCRIPTION =

      (ADDRESS_LIST =

        (ADDRESS = (PROTOCOL = TCP)(HOST = oradb95)(PORT = 1521))

      )

      (CONNECT_DATA =

        (SERVICE_NAME =   gbdb)

      )

    )

这样再也不用担心书写格式、写漏括号“)”啥的了。

得检验这些设置有没有用,在两台服务器分别执行如下指令进行验证:

[oracle@oradb95 admin]$ tnsping oradb95

 

TNS Ping Utility for Linux: Version   12.2.0.1.0 - Production on 15-JUN-2018 12:08:46

 

Copyright (c) 1997, 2016, Oracle.  All rights reserved.

 

Used parameter files:

 

 

Used TNSNAMES adapter to resolve the   alias

Attempting to contact (DESCRIPTION =   (ADDRESS_LIST = (ADDRESS = (PROTOCOL = TCP)(HOST = oradb95)(PORT = 1521)))   (CONNECT_DATA = (SERVICE_NAME = oradb95)))

OK   (0 msec)

[oracle@oradb95 admin]$ tnsping oradb162

 

TNS Ping Utility for Linux: Version   12.2.0.1.0 - Production on 15-JUN-2018 12:08:51

 

Copyright (c) 1997, 2016, Oracle.  All rights reserved.

 

Used parameter files:

 

 

Used TNSNAMES adapter to resolve the   alias

Attempting to contact (DESCRIPTION =   (ADDRESS_LIST = (ADDRESS = (PROTOCOL = TCP)(HOST = oradb162)(PORT = 1521)))   (CONNECT_DATA = (SERVICE_NAME = oradb162)))

OK   (0 msec)


◎主库启用归档及force logging强制记录日志

1、归档操作:检查主库是否处于归档,如果不是,则启用它,具体指令如下(启用要在mount下进行):

SQL> archive   log list;

Database   log mode              No Archive Mode

Automatic   archival             Disabled

Archive destination            USE_DB_RECOVERY_FILE_DEST

Oldest online log sequence     11

Current log sequence           13

 

SQL> alter   database archivelog;

 

Database altered.

SQL> archive   log list;

Database   log mode              Archive Mode

Automatic   archival             Enabled

Archive destination            USE_DB_RECOVERY_FILE_DEST

Oldest online log sequence     11

Next log sequence to archive   13

Current log sequence           13

SQL> alter database open;

 

Database altered.


2、force logging强制记录日志:先检查是否启用,如未则启用之(可在数据库open状态下执行),步骤如下:

SQL> select   force_logging from v$database;

 

FORCE_LOGGING

---------------------------------------

NO

 

SQL> alter   database force logging;

 

Database altered.

 

SQL> select   force_logging from v$database;

 

FORCE_LOGGING

---------------------------------------

YES

   

◎为备库准备控制文件

在主库上执行如下操作,生成的文件存放到一个临时的位置,后边等其它文件都到齐后,再把它移动到合适的位置。我参考好多文档,都在创建者玩意,但实际上我用rman复制方式创建备库,根本就不需要这个控制文件。分析原因,应该是这样:备库以 startup nomount pfile 方式启动实例,只读取参数文件而已;主库以rman同时连主备库,以指令“duplicate target database”从主库复制所需文件,也包括了控制文件。

SQL> alter   database create standby controlfile as '/home/oracle/gdbd.ctl';            

 

Database altered.


◎主库创建standby redo log

尽量与主库现有的日志文件大小相一致,创建的组不少于系统现有的。


查当前日志组大小

SQL> select   GROUP#,BYTES/1024/1024 size_M,STATUS,ARCHIVED from v$log;

 

    GROUP#     SIZE_M STATUS           ARC

---------- ---------- ----------------   ---

           1        200 CURRENT          NO

           2        200 INACTIVE         YES

           3        200 INACTIVE         YES

查存储路径

SQL> select   MEMBER from v$logfile;

 

MEMBER

--------------------------------------------------------------------------------

/u01/app/oracle/oradata/GBDB/onlinelog/o1_mf_3_fl1mvv1j_.log

/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/o1_mf_3_fl1mvvkc_.log

/u01/app/oracle/oradata/GBDB/onlinelog/o1_mf_2_fl1mvv0q_.log

/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/o1_mf_2_fl1mvvfs_.log

/u01/app/oracle/oradata/GBDB/onlinelog/o1_mf_1_fl1mvty3_.log

/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/o1_mf_1_fl1mvvgd_.log

 

6 rows selected.

###一个组两个成员,路径不同,大小内容完全一致

[root@oradb162 ~]# diff   /u01/app/oracle/oradata/GBDB/onlinelog/o1_mf_3_fl1mvv1j_.log   /u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/o1_mf_3_fl1mvvkc_.log

[root@oradb162 ~]# du   /u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/o1_mf_3_fl1mvvkc_.log

204804    /u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/o1_mf_3_fl1mvvkc_.log

[root@oradb162 ~]#   du /u01/app/oracle/oradata/GBDB/onlinelog/o1_mf_3_fl1mvv1j_.log

204804    /u01/app/oracle/oradata/GBDB/onlinelog/o1_mf_3_fl1mvv1j_.log

 

创建新的日志组,也存放在两个位置

 

SQL> alter   database add standby logfile group 4   ('/u01/app/oracle/oradata/GBDB/onlinelog/standby01.log','/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/stabdy01.log')   size 200M;

 

Database altered.

 

SQL> alter   database add standby logfile group 5   ('/u01/app/oracle/oradata/GBDB/onlinelog/standby02.log','/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/stabdy02.log')   size 200M;

 

Database altered.

 

SQL> alter   database add standby logfile group 6   ('/u01/app/oracle/oradata/GBDB/onlinelog/standby03.log','/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/stabdy03.log')   size 200M;

 

Database altered.

 

SQL> alter   database add standby logfile group 7 ('/u01/app/oracle/oradata/GBDB/onlinelog/standby04.log','/u01/app/oracle/fast_recovery_area/gbdb/GBDB/onlinelog/stabdy04.log')   size 200M;

 

Database altered.

 

验证所创建的组

SQL> select   group#,thread#,sequence#,archived,status from v$standby_log;

 

    GROUP#    THREAD#    SEQUENCE# ARC STATUS

---------- ---------- ---------- ---   ----------

           4          0          0 YES UNASSIGNED

           5          0          0 YES UNASSIGNED

           6          0          0 YES UNASSIGNED

           7          0          0 YES UNASSIGNED


◎准备初始化参数文件

主库上生成文件,复制到备库,然后两个参数文件都需要做修改,以符合实际需求。主库上对参数的修改,可以直接在sqlplus里执行alter语句,但这不太保险,一旦出错,容易给自己造成压力。建议修改参数文件前,做个原始备份,然后修改此参数文件。万一将来以此修改过的参数文件生成服务器参数文件(spfile)出现异常,备份的那个参数文件就是后悔药。


◆执行以下指令生成参数文件:

 SQL>   create pfile='/home/oracle/initgd.ora' from   spfile;

 

File created.

修改修改前做个原始备份

[oracle@oradb162 ~]$ pwd

/home/oracle

[oracle@oradb162 ~]$ cp   initgd.ora initgd.ora.bk20180617

复制一份参数文件initgd.ini到备库服务器的/home/oracle目录,等待修改。


◆修改主库参数文件/home/oracle/initgb.ora

在源文件的基础上增加如下内容(一行太长,有些行自动换行了,书写时请注意):

*.db_unique_name='oradb162'

*.fal_client='oradb162'

*.fal_server='oradb95'

*.log_archive_cOnfig='DG_COnFIG=(oradb162,oradb95)'

*.log_archive_dest_1='LOCATION=/u01/app/oracle/fast_recovery_area/gbdb/   VALID_FOR=(ALL_LOGFILES,ALL_ROLES) DB_UNIQUE_NAME=oradb162'

*.log_archive_dest_2='SERVICE=oradb95   LGWR ASYNC VALID_FOR=(ALL_LOGFILES,PRIMARY_ROLES) DB_UNIQUE_NAME=oradb95'

*.log_archive_dest_state_1='ENABLE'

*.log_archive_dest_state_2='ENABLE'

*.standby_file_management='AUTO'


◆准备库参数文件/home/oracle/initgb.ora

从主库复制文件,用同样路径。把所需文件放在/home/oracle目录,一来没权限不足的问题,而来不会与其它数据文件混在一起,等dataguard运行起来以后,这些文件就基本不再使用,不干扰后期维护。

备库参数文件/home/oracle/initgb.ora的内容如下,与主库不同的地方,特别用底色做了标记。

[oracle@oradb95 ~]$ more initgb.ora

gbdb.__data_transfer_cache_size=0

gbdb.__db_cache_size=7918845952

gbdb.__inmemory_ext_roarea=0

gbdb.__inmemory_ext_rwarea=0

gbdb.__java_pool_size=67108864

gbdb.__large_pool_size=100663296

gbdb.__oracle_base='/u01/app/oracle'#ORACLE_BASE   set from environment

gbdb.__pga_aggregate_target=3388997632

gbdb.__sga_target=10099884032

gbdb.__shared_io_pool_size=536870912

gbdb.__shared_pool_size=1442840576

gbdb.__streams_pool_size=0

*.audit_file_dest='/u01/app/oracle/admin/gbdb/adump'

*.audit_trail='db'

*.compatible='12.2.0'

*.control_files='/u01/app/oracle/oradata/GBDB/controlfile/o1_mf_fl1mvrh4_.ctl','/u01/app/oracle/fast_recovery_area/gbdb/GBDB/controlfile

controlfile/o1_mf_fl1mvrls_.ctl'

*.db_block_size=8192

*.db_create_file_dest='/u01/app/oracle/oradata'

*.db_name='gbdb'

*.db_recovery_file_dest='/u01/app/oracle/fast_recovery_area/gbdb'

*.db_recovery_file_dest_size=8016m

*.diagnostic_dest='/u01/app/oracle'

*.dispatchers='(PROTOCOL=TCP) (SERVICE=gbdbXDB)'

*.local_listener='LISTENER_GBDB'

*.open_cursors=300

*.pga_aggregate_target=3209m

*.processes=640

*.remote_login_passwordfile='EXCLUSIVE'

*.sga_target=9627m

*.undo_tablespace='UNDOTBS1'

 

*.db_unique_name='oradb95'

*.fal_client='oradb95'

*.fal_server='oradb162'

*.log_archive_cOnfig='DG_COnFIG=(oradb162,oradb95)'

*.log_archive_dest_1='LOCATION=/u01/app/oracle/fast_recovery_area/gbdb/   VALID_FOR=(ALL_LOGFILES,ALL_ROLES) DB_UNIQUE_NAME=oradb95'

*.log_archive_dest_2='SERVICE=oradb162 LGWR ASYNC   VALID_FOR=(ALL_LOGFILES,PRIMARY_ROLES) DB_UNIQUE_NAME=oradb162'

*.log_archive_dest_state_1='ENABLE'

*.log_archive_dest_state_2='ENABLE'

*.standby_file_management='AUTO'


两台云服务器(主备库)资源配置、操作系统版本、oracle软件、目录结构完全一样,因此不需要做日志和数据文件转换。书写参数文件一定要仔细认真,我在这里踩了个大坑,整个端午节都耗在上边了。

参数文件里边有几个值,要特别留意。db_name、db_unique_name、service,该怎么填?与哪些项目想关联,是必须弄清楚的。

(1)   db_name:主备库用同样的名称,这里用的值是gbdb,oracle系统账号环境变量.bash_profile里边定义。

(2)   db_unique:主库与备库不同,主库定义为oradb162,备库为oradb95,与系统的/etc/hosts定义相同,也可以不同。也可以在oracle系统账号环境变量.bash_profile里边也设定一下。

(3)   service:这个最容易引起混淆,个人认为,应该是从tnsname.ora取值,取的是那个net service name,不是代码块里边那个service(代码块顶头的那行,没有括号,而真正的service,使用相同的设置gbdb,与sid也设定得一样了)。

我犯的低级错误就在参数文件的log_archive_dest_1这一行,因为这行很长,转换到下一行了,担心不是一个正行,因此使用了删除,未曾留心,把DB_UNIQUE_NAME=oradb162的字符“a”给删掉,变成DB_UNIQUE_NAME=ordb162,配置完以后,死活不能同步数据。查看oracle告警日志,有log1目标找不到的信息,一直以为是监听器监或者是是本地名称服务tnsnames设置的问题呢。Sqlplus执行 show parameter log_archive_dest能得到一些有用信息。


◆备库服务器创建所需目录

创建这些目录的依据来自参数文件/home/oracle/initgb.ora,需逐个核对创建。

1、 创建控制文件目录:

[oracle@oradb95 ~]$ mkdir   /u01/app/oracle/oradata/GBDB/controlfile -p

[oracle@oradb95 ~]$ mkdir   /u01/app/oracle/fast_recovery_area/gbdb/GBDB/controlfile -p

2、 创建归档日志目录:

[oracle@oradb95 ~]$mkdir /u01/app/oracle/fast_recovery_area/gbdb -p

这步重复了,在创建控制文件目录时,已经创建过了。

3、 创建审计文件目录:

[oracle@oradb95 ~]$ mkdir -p /u01/app/oracle/admin/gbdb/adump

◆备库服务器准备密码文件及控制文件

这两个文件都来自于主库服务器,直接同步或者复制过来,注意不要改变文件的属主,即这些文件的属主是oracle和oinstall。

1、 根据参数文件的定义,我们需要把控制文件分别同步到目录(这个步骤其实是多此一举了)/u01/app/oracle/oradata/GBDB/controlfile/,/u01/app/oracle/fast_recovery_area/gbdb/GBDB/controlfile/。

[oracle@oradb95 ~]$  cp gdbd.ctl /u01/app/oracle/oradata/GBDB/controlfile [oracle@oradb95 ~]$  cp gdbd.ctl   /u01/app/oracle/fast_recovery_area/gbdb/GBDB/controlfile/


2、 复制数据库密码文件到目录/u01/app/oracle/product/12.2.0/dbs.

[oracle@oradb95 ~]$ cp orapwgbdb /u01/app/oracle/product/12.2.0/dbs


文件位于什么位置,一定要跟定义及oracle规定相符合。一些人写的文档,不做强调,一顿乱贴;在哪个机器操作,主机命名,模棱两可,给初学者带来很多麻烦和困扰。

实际上,备库有参数文件和密码文件就够了。如果在执行数据库复制过程出现异常,极有可能是备库的目录没有被创建,根据提示创建就行。控制文件会自动被复制过来,因此无需手动搞一遍。


◎复制数据库到备库

分五个步骤,有顺序地进行。

◆第一步:主库以mount参数启动实例:

SQL> startup mount   pfile='/home/oracle/initgb.ora';

ORACLE instance started.

 

Total System Global Area 1.0100E+10 bytes

Fixed Size                 12170040 bytes

Variable Size            1979714760 bytes

Database Buffers         8086618112 bytes

Redo Buffers               21381120 bytes

Database mounted.

参数文件有错的话,换成原始备份的那个,就可以恢复到正常状况,比直接sql里改参数要保险一些。


第二步,备库启动oracle实例。一定要安装好oracle软件,复制主库的密码文件到对应的位置,还有那个参数文件,位置随意,能读取就行。

[oracle@oradb95 ~]$ sqlplus / as   sysdba

 

SQL*Plus: Release 12.2.0.1.0 Production on Tue Jun   19 12:59:58 2018

 

Copyright (c) 1982, 2016, Oracle.  All rights reserved.

 

Connected to an idle instance.

 

SQL> startup nomount   pfile='/home/oracle/initgb.ora';

ORACLE instance started.

 

Total System Global Area 1.0100E+10 bytes

Fixed Size                 12170040 bytes

Variable Size              1979714760 bytes

Database Buffers         8086618112 bytes

Redo Buffers               21381120 bytes

注意:主库是mount参数,备库是nomount。nomount不需要使用控制文件。


◆第三步,rman连主备库,这个是在主库上进行的操作:

[oracle@oradb162 oradata]$rman target sys/Oradb_162@oradb162 auxiliary   sys/Oradb_162@oradb95

Recovery Manager: Release 12.2.0.1.0 - Production   on Tue Jun 19 12:46:55 2018

 

Copyright (c) 1982, 2017, Oracle and/or its   affiliates.  All rights reserved.

 

connected to target database: GBDB (DBID=2214703447,   not open)

connected to auxiliary database: GBDB (not   mounted)

注意:连接字串只有@后边的服务名不同,其它要一样哟。为了不引起混乱,也可以简化成“rman target /  auxiliary sys/Oradb_162@oradb95”。


◆第四步,复制数据库到备库,还是在主库执行呢,就在rman提示符里边。

RMAN>duplicate target database   for standby from active database nofilenamecheck;

………大量输出,略…………………


这一步是容易出问题的地方,要注意看输出,最可能的原因就是需要的目录没有手工创建。另外,如果跟我想法相同(主备目录结构相同、oracle sid也相同),那么用rman复制时把参数nofilenamecheck”加上。


◆第五步,主库打开数据库。

SQL> alter database open;

 

Database altered.

   

◎启动备库,使其与主库同步

SQL> ALTER DATABASE RECOVER   MANAGED STANDBY DATABASE USING CURRENT LOGFILE  DISCONNECT FROM SESSION;

 

Database altered.

复制完数据库以后,备库把自己切换成mount状态了,因此无需人为干涉。

 

◎验证主备同步状况

暴力一点,主库上创建一个表空间,等待片刻,分别查看两边文件的生成情况。

SQL> create tablespace   WUHUSER  datafile   ‘/u01/app/oracle/oradata/whcrm/wuhuser01.fbf’ size 10G;

登录到到备库,查看目录,看是否自动生成数据文件。

[oracle@oradb95 oradata]$ pwd

/u01/app/oracle/oradata

[oracle@oradb95 oradata]$ ls -al

total 4194332

drwxr-xr-x    4 oracle oinstall       4096 Jun   19 10:43 .

drwxrwxr-x 10 oracle oinstall       4096 Jun 18 14:15 ..

drwxr-xr-x    3 oracle oinstall       4096 Jun   18 22:17 gbdb

drwxr-xr-x    3 oracle oinstall       4096 Jun   18 15:27 GBDB

-rw-r-----  1 oracle oinstall 4294975488 Jun 19 13:19   wuhuser01.dbf

同时也查看两边的oracle告警日志,做进一步核实。再增一法,主备库查归档情况。

主库执行

SQL> alter system switch logfile;

 

System altered

SQL> select   SEQUENCE#,FIRST_TIME,NEXT_TIME ,APPLIED from v$archived_log;

…………………………省略若干…………………

SEQUENCE# FIRST_TIM NEXT_TIME APPLIED

---------- --------- --------- ---------

        46   19-JUN-18 19-JUN-18 NO

        46   19-JUN-18 19-JUN-18 YES

        47   19-JUN-18 19-JUN-18 NO

        47   19-JUN-18 19-JUN-18 YES

        48   19-JUN-18 19-JUN-18 NO

        48 19-JUN-18 19-JUN-18 NO

 

94 rows selected.

备库执行

select SEQUENCE#,FIRST_TIME,NEXT_TIME ,APPLIED   from v$archived_log;

…………………………省略若干…………………

SEQUENCE# FIRST_TIM NEXT_TIME APPLIED

---------- --------- --------- ---------

        37   19-JUN-18 19-JUN-18 YES

        38   19-JUN-18 19-JUN-18 YES

        39   19-JUN-18 19-JUN-18 YES

        40   19-JUN-18 19-JUN-18 YES

        41   19-JUN-18 19-JUN-18 YES

        42   19-JUN-18 19-JUN-18 YES

        43   19-JUN-18 19-JUN-18 YES

        44   19-JUN-18 19-JUN-18 YES

        45   19-JUN-18 19-JUN-18 YES

        46   19-JUN-18 19-JUN-18 YES

        47 19-JUN-18   19-JUN-18 YES

 

 SEQUENCE#   FIRST_TIM NEXT_TIME APPLIED

---------- --------- --------- ---------

        48 19-JUN-18 19-JUN-18   IN-MEMORY

 

34 rows selected.


Dataguard主备角色切换

为保证可靠性,需要进行主库->备库,备库->主库;原主库->主库,原备库->备库。能变过去也能变回来,方为好手。

切换有操作顺序,需先在主库操作,使其变成备库,然后才可以在备库进行切换。

 

◎主库切换成备库

查看主库切换状态:

SQL> select switchover_status   from v$database;

 

SWITCHOVER_STATUS

--------------------

TO STANDBY

主库变备库:

SQL> alter database commit to   switchover to standby;

 

Database altered.

主库再启动实例(现在角色是standby备库了)

SQL> startup   mount;

ORACLE instance started.

 

Total System Global Area 1.0100E+10 bytes

Fixed Size                 12170040 bytes

Variable Size            1979714760 bytes

Database Buffers         8086618112 bytes

Redo Buffers               21381120 bytes

Database mounted.

SQL> ALTER DATABASE RECOVER   MANAGED STANDBY DATABASE USING CURRENT LOGFILE DISCONNECT FROM SESSION;

 

Database altered.

   

◎备库变主库

主库活着的话,执行“select switchover_status from v$database;”得到的输出为“NOT ALLOWED”。主库转换成备库完成后,再执行这个指令,这时输出为:

SQL> select switchover_status   from v$database;

 

SWITCHOVER_STATUS

--------------------

TO PRIMARY

备库角色切换到主库

SQL> alter   database commit to switchover to primary;

 

Database altered.

数据库打开,这步别忘记了。

SQL> alter database open;

 

Database altered.

重复执行上述步骤,又可以把角色还原。为防止意外,我强烈建议他们再增加一个云主机,把oracle安装好,一旦主库故障,立即把备库提升成主库,同时把预留的那台做数据库服务,使之成为新的standby备库。发生故障的主库修复以后,准备好oracle,留着备用。


老田有话说

最近受邀在51CTO博客专栏出版《负载均衡高手炼成记》,依托自己十余年的IT运维经验,以实际工作经验为基础,介绍不同场景下,负载均衡的实现方式,以及负载均衡的日常维护。
本专栏适合于一直徘徊在运维初级未找到入佳境之门的运维工程师,也适合对负载均衡有兴趣了解和学习的技术爱好者。跟着老田学完这个系列课程,不仅学知识,更是涨薪、升职、进心仪公司的一大捷径!

《负载均衡高手炼成记》