LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1649|回复: 0

监控Oracle数据库的常用shell脚本

[复制链接]
发表于 2004-5-29 19:25:39 | 显示全部楼层 |阅读模式
前言

  这篇文章介绍了DBA每天在监控Oracle数据库方面的职责,讲述了如何通过shell脚本来完成这些重复的监控工作。
本文首先回顾了一些DBA常用的Unix命令,以及解释了如何通过Unix
Cron来定时执行DBA脚本。同时文章还介绍了8个重要的脚本来监控Oracle数据库:

   检查实例的可用性
 
   检查监听器的可用性

   检查alert日志文件中的错误信息
 
   在存放log文件的地方满以前清空旧的log文件

   分析table和index以获得更好的性能

   检查表空间的使用情况

   找出无效的对象

   监控用户和事务

  DBA需要的Unix基本知识

  基本的UNIX命令

  以下是一些常用的Unix命令:
   ps--显示进程
   grep--搜索文件中的某种文本模式
   mailx--读取或者发送mail
   cat--连接文件或者显示它们
   cut--选择显示的列
   awk--模式匹配语言
   df--显示剩余的磁盘空间

  以下是DBA如何使用这些命令的一些例子:

  显示服务器上的可用实例:


  1. $ ps -ef | grep smon
  2. oracle 21832 1 0 Feb 24 ? 19:05 ora_smon_oradb1
  3. oracle 898 1 0 Feb 15 ? 0:00 ora_smon_oradb2
  4. dliu 25199 19038 0 10:48:57 pts/6 0:00 grep smon
  5. oracle 27798 1 0 05:43:54 ? 0:00 ora_smon_oradb3
  6. oracle 28781 1 0 Mar 03 ? 0:01 ora_smon_oradb4、       
复制代码

  显示服务器上的可用监听器:


  1. $ ps -ef | grep listener | grep -v grep
  2. (译者注:grep命令应该加上-i参数,即grep -i listener,该参数的作用是忽略大小写,因为有些时候listener是大写的,这时就会看不到结果)
  3. oracle 23879 1 0 Feb 24 ? 33:36 /8.1.7/bin/tnslsnr listener_db1 -inherit
  4. oracle 27939 1 0 05:44:02 ? 0:00 /8.1.7/bin/tnslsnr listener_db2 -inherit
  5. oracle 23536 1 0 Feb 12 ? 4:19 /8.1.7/bin/tnslsnr listener_db3 -inherit
  6. oracle 28891 1 0 Mar 03 ? 0:01 /8.1.7/bin/tnslsnr listener_db4 -inherit       
复制代码

  查看Oracle存档目录的文件系统使用情况


  1. $ df -k | grep oraarch
  2. /dev/vx/dsk/proddg/oraarch 71123968 4754872 65850768 7% /u09/oraarch       
  3. [code]
  4.   统计alter.log文件中的行数:

  5. [code]
  6. $ cat alert.log | wc -l
  7. 2984
  8.        
复制代码

  列出alert.log文件中的全部Oracle错误信息:


  1. $ grep ORA- alert.log
  2. ORA-00600: internal error code, arguments: [kcrrrfswda.1], [], [], [], [], []
  3. ORA-00600: internal error code, arguments: [1881], [25860496], [25857716], []       
复制代码

  CRONTAB基本知识

  一个crontab文件中包含有六个字段:
  分钟 0-59

  小时 0-23

  月中的第几天 1-31

  月份 1 - 12

  星期几 0 - 6, with 0 = Sunday

  Unix命令或者Shell脚本

  要编辑一个crontab文件,输入:

  Crontab -e

  要查看一个crontab文件,输入:


  1. Crontab -l
  2. 0 4 * * 5 /dba/admin/analyze_table.ksh
  3. 30 3 * * 3,6 /dba/admin/hotbackup.ksh /dev/null 2>&1       
复制代码

  在上面的例子中,第一行显示了一个分析表的脚本在每个星期5的4:00am运行。第二行显示了一个执行热备份的脚本在每个周三和周六的3:00a.m.运行。

监控数据库的常用Shell脚本

  以下提供的8个shell脚本覆盖了DBA每日监控工作的90%,你可能还需要修改UNIX的环境变量。

  检查Oracle实例的可用性

  oratab文件中列出了服务器上的所有数据库


  1. $ cat /var/opt/oracle/oratab
  2. ###################################################################
  3. ## /var/opt/oracle/oratab ##
  4. ###################################################################
  5. oradb1:/u01/app/oracle/product/8.1.7:Y
  6. oradb2:/u01/app/oracle/product/8.1.7:Y
  7. oradb3:/u01/app/oracle/product/8.1.7:N
  8. oradb4:/u01/app/oracle/product/8.1.7:Y       
复制代码

  以下的脚本检查oratab文件中列出的所有数据库,并且找出该数据库的状态(启动还是关闭)


  1. ###################################################################
  2. ## ckinstance.ksh ## ###################################################################
  3. ORATAB=/var/opt/oracle/oratab
  4. echo "`date` "
  5. echo "Oracle Database(s) Status `hostname` :\n"

  6. db=`egrep -i ":Y|:N" $ORATAB | cut -d":" -f1 | grep -v "\#" | grep -v "\*"`
  7. pslist="`ps -ef | grep pmon`"
  8. for i in $db ; do
  9. echo "$pslist" | grep "ora_pmon_$i" > /dev/null 2>$1
  10. if (( $? )); then
  11. echo "Oracle Instance - $i: Down"
  12. else
  13. echo "Oracle Instance - $i: Up"
  14. fi
  15. done
  16.        
复制代码


  使用以下的命令来确认该脚本是可以执行的:


  1. $ chmod 744 ckinstance.ksh
  2. $ ls -l ckinstance.ksh
  3. -rwxr--r-- 1 oracle dba 657 Mar 5 22:59 ckinstance.ksh*       
复制代码

  以下是实例可用性的报表:


  1. $ ckinstance.ksh
  2. Mon Mar 4 10:44:12 PST 2002
  3. Oracle Database(s) Status for DBHOST server:
  4. Oracle Instance - oradb1: Up
  5. Oracle Instance - oradb2: Up
  6. Oracle Instance - oradb3: Down
  7. Oracle Instance - oradb4: Up         [color=red]
复制代码

  检查Oracle监听器的可用性

  以下有一个类似的脚本检查Oracle监听器。如果监听器停了,该脚本将会重新启动监听器:


  1. #######################################################################
  2. ## cklsnr.sh ##
  3. #######################################################################
  4. #!/bin/ksh
  5. DBALIST="primary.dba@company.com,another.dba@company.com";export DBALIST
  6. cd /var/opt/oracle
  7. rm -f lsnr.exist
  8. ps -ef | grep mylsnr | grep -v grep > lsnr.exist
  9. if [ -s lsnr.exist ]
  10. then
  11. echo
  12. else
  13. echo "Alert" | mailx -s "Listener 'mylsnr' on `hostname` is down" $DBALIST
  14. TNS_ADMIN=/var/opt/oracle; export TNS_ADMIN
  15. ORACLE_SID=db1; export ORACLE_SID
  16. ORAENV_ASK=NO; export ORAENV_ASK
  17. PATH=$PATH:/bin:/usr/local/bin; export PATH
  18. . oraenv
  19. LD_LIBRARY_PATH=${ORACLE_HOME}/lib;export LD_LIBRARY_PATH
  20. lsnrctl start mylsnr
  21. fi
复制代码

       

  检查Alert日志(ORA-XXXXX)

  每个脚本所使用的一些环境变量可以放到一个profile中:


  1. #######################################################################
  2. ## oracle.profile ##
  3. #######################################################################
  4. EDITOR=vi;export EDITOR ORACLE_BASE=/u01/app/oracle; export
  5. ORACLE_BASE ORACLE_HOME=$ORACLE_BASE/product/8.1.7; export
  6. ORACLE_HOME LD_LIBRARY_PATH=$ORACLE_HOME/lib; export
  7. LD_LIBRARY_PATH TNS_ADMIN=/var/opt/oracle;export
  8. TNS_ADMIN NLS_LANG=american; export
  9. NLS_LANG NLS_DATE_FORMAT='Mon DD YYYY HH24:MI:SS'; export
  10. NLS_DATE_FORMAT ORATAB=/var/opt/oracle/oratab;export
  11. ORATAB PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr/bin:/usr/sbin:/
  12. sbin:/usr/openwin/bin:/opt/bin:.; export
  13. PATH DBALIST="primary.dba@company.com,another.dba@company.com";export
  14. DBALIST        
复制代码

  以下的脚本首先调用oracle.profile来设置全部的环境变量。如果发现任何的Oracle错误,该脚本还会给DBA发送一个警告的email。


  1. ####################################################################
  2. ## ckalertlog.sh ##
  3. ####################################################################
  4. #!/bin/ksh
  5. .. /etc/oracle.profile
  6. for SID in `cat $ORACLE_HOME/sidlist`
  7. do
  8. cd $ORACLE_BASE/admin/$SID/bdump
  9. if [ -f alert_${SID}.log ]
  10. then
  11. mv alert_${SID}.log alert_work.log
  12. touch alert_${SID}.log
  13. cat alert_work.log >> alert_${SID}.hist
  14. grep ORA- alert_work.log > alert.err
  15. fi
  16. if [ `cat alert.err|wc -l` -gt 0 ]
  17. then
  18. mailx -s "${SID} ORACLE ALERT ERRORS" $DBALIST < alert.err
  19. fi
  20. rm -f alert.err
  21. rm -f alert_work.log
  22. done
复制代码

       

  清除旧的归档文件

  以下的脚本将会在log文件达到90%容量的时候清空旧的归档文件:


  1. $ df -k | grep arch
  2. Filesystem kbytes used avail capacity Mounted on
  3. /dev/vx/dsk/proddg/archive 71123968 30210248 40594232 43% /u08/archive

  4. #######################################################################
  5. ## clean_arch.ksh ##
  6. #######################################################################
  7. #!/bin/ksh
  8. df -k | grep arch > dfk.result
  9. archive_filesystem=`awk -F" " '{ print $6 }' dfk.result`
  10. archive_capacity=`awk -F" " '{ print $5 }' dfk.result`

  11. if [[ $archive_capacity > 90% ]]
  12. then
  13. echo "Filesystem ${archive_filesystem} is ${archive_capacity} filled"
  14. # try one of the following option depend on your need
  15. find $archive_filesystem -type f -mtime +2 -exec rm -r {} \;
  16. tar
  17. rman
  18. fi
复制代码


分析表和索引(以得到更好的性能)


  以下我将展示如果传送参数到一个脚本中:


  1. ####################################################################
  2. ## analyze_table.sh ##
  3. ####################################################################
  4. #!/bin/ksh
  5. # input parameter: 1: password # 2: SID
  6. if (($#<1)) then echo "Please enter 'oracle' user password as the first parameter !" exit 0
  7. fi
  8. if (($#<2)) then echo "Please enter instance name as the second parameter!" exit 0
  9. fi
  10.        
复制代码

  要传入参数以执行该脚本,输入:


  1. $ analyze_table.sh manager oradb1        
复制代码

  脚本的第一部分产生了一个analyze.sql文件,里面包含了分析表用的语句。脚本的第二部分分析全部的表:


  1. #####################################################################
  2. ## analyze_table.sh ##
  3. #####################################################################
  4. sqlplus -s < oracle/$1@$2
  5. set heading off
  6. set feed off
  7. set pagesize 200
  8. set linesize 100
  9. spool analyze_table.sql
  10. select 'ANALYZE TABLE ' || owner || '.' || segment_name ||
  11. ' ESTIMATE STATISTICS SAMPLE 10 PERCENT;'
  12. from dba_segments
  13. where segment_type = 'TABLE'
  14. and owner not in ('SYS', 'SYSTEM');
  15. spool off
  16. exit
  17. !
  18. sqlplus -s < oracle/$1@$2
  19. @./analyze_table.sql
  20. exit
  21. !        
复制代码

  以下是analyze.sql的一个例子:


  1. $ cat analyze.sql
  2. ANALYZE TABLE HIRWIN.JANUSAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  3. ANALYZE TABLE HIRWIN.JANUSER_PROFILE ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  4. ANALYZE TABLE APPSSYS.HIST_SYSTEM_ACTIVITY ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  5. ANALYZE TABLE HTOMEH.QUEST_IM_VERSION ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  6. ANALYZE TABLE JSTENZEL.HIST_SYS_ACT_0615 ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  7. ANALYZE TABLE JSTENZEL.HISTORY_SYSTEM_0614 ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  8. ANALYZE TABLE JSTENZEL.CALC_SUMMARY3 ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  9. ANALYZE TABLE IMON.QUEST_IM_LOCK_TREE ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  10. ANALYZE TABLE APPSSYS.HIST_USAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  11. ANALYZE TABLE PATROL.P$LOCKCONFLICTTX ESTIMATE STATISTICS SAMPLE 10 PERCENT;
  12.        
复制代码


  检查表空间的使用

  以下的脚本检测表空间的使用。如果表空间只剩下10%,它将会发送一个警告email。


  1. #####################################################################
  2. ## ck_tbsp.sh ##
  3. #####################################################################
  4. #!/bin/ksh
  5. sqlplus -s < oracle/$1@$2
  6. set feed off
  7. set linesize 100
  8. set pagesize 200
  9. spool tablespace.alert
  10. SELECT F.TABLESPACE_NAME,
  11. TO_CHAR ((T.TOTAL_SPACE - F.FREE_SPACE),'999,999') "USED (MB)",
  12. TO_CHAR (F.FREE_SPACE, '999,999') "FREE (MB)",
  13. TO_CHAR (T.TOTAL_SPACE, '999,999') "TOTAL (MB)",
  14. TO_CHAR ((ROUND ((F.FREE_SPACE/T.TOTAL_SPACE)*100)),'999')||' %' PER_FREE
  15. FROM (
  16. SELECT TABLESPACE_NAME,
  17. ROUND (SUM (BLOCKS*(SELECT VALUE/1024
  18. FROM V\$PARAMETER
  19. WHERE NAME = 'db_block_size')/1024)
  20. ) FREE_SPACE
  21. FROM DBA_FREE_SPACE
  22. GROUP BY TABLESPACE_NAME
  23. ) F,
  24. (
  25. SELECT TABLESPACE_NAME,
  26. ROUND (SUM (BYTES/1048576)) TOTAL_SPACE
  27. FROM DBA_DATA_FILES
  28. GROUP BY TABLESPACE_NAME
  29. ) T
  30. WHERE F.TABLESPACE_NAME = T.TABLESPACE_NAME
  31. AND (ROUND ((F.FREE_SPACE/T.TOTAL_SPACE)*100)) < 10;
  32. spool off
  33. exit
  34. !
  35. if [ `cat tablespace.alert|wc -l` -gt 0 ]
  36. then
  37. cat tablespace.alert -l tablespace.alert > tablespace.tmp
  38. mailx -s "TABLESPACE ALERT for ${2}" $DBALIST < tablespace.tmp
  39. fi
  40.        
复制代码

  警告email输出的例子如下:


  1. TABLESPACE_NAME USED (MB) FREE (MB) TOTAL (MB) PER_FREE
  2. ------------------- --------- ----------- ------------------- ------------------
  3. SYSTEM 2,047 203 2,250 9 %
  4. STBS01 302 25 327 8 %
  5. STBS02 241 11 252 4 %
  6. STBS03 233 19 252 8 %
复制代码


  查找出无效的数据库对象

  以下查找出无效的数据库对象:


  1. ##################################################################### ## invalid_object_alert.sh ## ##################################################################### #!/bin/ksh . /etc/oracle.profile
  2. sqlplus -s < oracle/$1@$2
  3. set feed off
  4. set heading off column object_name format a30
  5. spool invalid_object.alert
  6. SELECT OWNER, OBJECT_NAME, OBJECT_TYPE, STATUS FROM DBA_OBJECTS WHERE STATUS = 'INVALID' ORDER BY OWNER, OBJECT_TYPE, OBJECT_NAME;
  7. spool off
  8. exit ! if [ `cat invalid_object.alert|wc -l` -gt 0 ] then
  9. mailx -s "INVALID OBJECTS for ${2}" $DBALIST < invalid_object.alert
  10. fi$ cat invalid_object.alert
  11. OWNER OBJECT_NAME OBJECT_TYPE STATUS
  12. ----------------------------------------------------------------------
  13. HTOMEH DBMS_SHARED_POOL PACKAGE BODY INVALID
  14. HTOMEH X_$KCBFWAIT VIEW INVALID
  15. IMON IW_MON PACKAGE INVALID
  16. IMON IW_MON PACKAGE BODY INVALID
  17. IMON IW_ARCHIVED_LOG VIEW INVALID
  18. IMON IW_FILESTAT VIEW INVALID
  19. IMON IW_SQL_FULL_TEXT VIEW INVALID
  20. IMON IW_SYSTEM_EVENT1 VIEW INVALID
  21. IMON IW_SYSTEM_EVENT_CAT VIEW INVALIDLBAILEY CHECK_TABLESPACE_USAGE PROCEDURE INVALID
  22. PATROL P$AUTO_EXTEND_TBSP VIEW INVALID
  23. SYS DBMS_CRYPTO_TOOLKIT PACKAGE INVALID
  24. SYS DBMS_CRYPTO_TOOLKIT PACKAGE BODY INVALID
  25. SYS UPGRADE_SYSTEM_TYPES_TO_816 PROCEDURE INVALID
  26. SYS AQ$_DEQUEUE_HISTORY_T TYPE INVALID
  27. SYS HS_CLASS_CAPS VIEW INVALID SYS HS_CLASS_DD VIEW INVALID       
复制代码

  监视用户和事务(死锁等)

  以下的脚本在死锁发生的时候发送一个警告e-mail:


  1. ###################################################################
  2. ## deadlock_alert.sh ##
  3. ###################################################################
  4. #!/bin/ksh
  5. .. /etc/oracle.profile
  6. sqlplus -s < oracle/$1@$2
  7. set feed off
  8. set heading off
  9. spool deadlock.alert
  10. SELECT SID, DECODE(BLOCK, 0, 'NO', 'YES' ) BLOCKER,
  11. DECODE(REQUEST, 0, 'NO','YES' ) WAITER
  12. FROM V$LOCK
  13. WHERE REQUEST > 0 OR BLOCK > 0
  14. ORDER BY block DESC;
  15. spool off
  16. exit
  17. !
  18. if [ `cat deadlock.alert|wc -l` -gt 0 ]
  19. then
  20. mailx -s "DEADLOCK ALERT for ${2}" $DBALIST < deadlock.alert
  21. fi
  22.        
复制代码

  结论

0,20,40 7-17 * * 1-5 /dba/scripts/ckinstance.sh > /dev/null 2>&1
0,20,40 7-17 * * 1-5 /dba/scripts/cklsnr.sh > /dev/null 2>&1
0,20,40 7-17 * * 1-5 /dba/scripts/ckalertlog.sh > /dev/null 2>&1
30 * * * 0-6 /dba/scripts/clean_arch.sh > /dev/null 2>&1
* 5 * * 1,3 /dba/scripts/analyze_table.sh > /dev/null 2>&1
* 5 * * 0-6 /dba/scripts/ck_tbsp.sh > /dev/null 2>&1
* 5 * * 0-6 /dba/scripts/invalid_object_alert.sh > /dev/null 2>&1
0,20,40 7-17 * * 1-5 /dba/scripts/deadlock_alert.sh > /dev/null 2>&1       

  通过以上的脚本,可大大减轻你的工作。你可以使用这些是来做更重要的工作,例如性能调整。
转自: http://www.yesky.com/SoftChannel ... 21029/1637243.shtml
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表