DP的RDS服务无法启动


今天遇到个问题,dp备份arch时,在dp的界面报错daemon is not running,

进一步查看detail发现是dp的rds服务没有启动,

由于dp的cell manager是安装在windows 2003 server的机器上,通过控制面板的服务,无法启动,在命令行里面也启动不了:

Microsoft Windows [版本 5.2.3790]
(C) 版权所有 1985-2003 Microsoft Corp.
 
C:\Documents and Settings\Administrator>omnisv -status
    ProcName  Status  [PID]
===============================
    rds     : Down
    crs     : Active  [664]
    mmd     : Active  [884]
    omniinet: Active  [712]
    Sending of traps disabled.
===============================
Status: At least one of Data Protector relevant processes/services is not running.
 
C:\Documents and Settings\Administrator>omnisv -?
 
usage: omnisv (-start | -stop | -status | -start_mon | -version | -help)
 
C:\Documents and Settings\Administrator>omnisv -stop
HP OpenView Storage Data Protector services successfully stopped.
 
 
C:\Documents and Settings\Administrator>omnisv -status
    ProcName  Status  [PID]
===============================
    rds     : Down
    crs     : Down
    mmd     : Down
    omniinet: Down
    Sending of traps disabled.
===============================
Status: At least one of Data Protector relevant processes/services is not running.
 
C:\Documents and Settings\Administrator>omnisv -start
Cannot start "rds" service, system error:
[1053] 服务没有及时响应启动或控制请求。
 
 
C:\Documents and Settings\Administrator>omnisv -status
    ProcName  Status  [PID]
===============================
    rds     : Down
    crs     : Active  [7696]
    mmd     : Active  [7712]
    omniinet: Active  [7532]
    Sending of traps disabled.
===============================
Status: At least one of Data Protector relevant processes/services is not running.
 
C:\Documents and Settings\Administrator>

重启windows机器,rds服务还是无法启动,咨询HP 800后,工程师建议重装DP或者打patch。

windows上的patch还算简单,下载了EXE文件后,停dp的所有服务,直接点击即可安装,且在安装时还会提醒,是否需要备份文件,以便在uninstall patch的时候可以回滚。

但是再次启动dp的服务,发现rds服务还是无法启动。

后来在HP的支持中心网站找到了答案:
1. 终止 hung omnisv.sh start 进程。
2. 将 /var/opt/omni/?db/syslog/rAAA* 移到一个临时的位置。
3. 将 /var/opt/omni/db/catalog/rdm.chi 移到一个临时的位置。
4. omnisv.sh start

上面说的linux/unix的系统的cell manager,类似的,在windows上,
1.停DP服务

C:\Program Files\OmniBack\bin>omnisv stop
HP OpenView Storage Data Protector services successfully stopped.
 
 
C:\Program Files\OmniBack\bin>omnisv status
    ProcName  Status  [PID]
===============================
    rds     : Down
    crs     : Down
    mmd     : Down
    omniinet: Down
    Sending of traps disabled.
===============================
Status: At least one of Data Protector relevant processes/services is not running.

2.将C:\Program Files\OmniBack\db40\logfiles\syslog\下所有的文件的转移到一临时文件夹

3.将C:\Program Files\OmniBack\db40\datafiles\catalog\rdm.chi 移到一个临时的文件夹。

4.启动DP服务:

C:\Program Files\OmniBack\bin>omnisv start
HP OpenView Storage Data Protector services successfully started.
 
 
C:\Program Files\OmniBack\bin>omnisv status
    ProcName  Status  [PID]
===============================
    rds     : Active  [6568]
    crs     : Active  [888]
    mmd     : Active  [7784]
    omniinet: Active  [6304]
    Sending of traps disabled.
===============================
Status: All Data Protector relevant processes/services up and running.

至此,问题解决,测试备份arch文件正常。

[Normal] From: BSM@pro_dbbak_01 "product_db_arch"  Time: 2008-1-2 16:15:17
    OB2BAR application on "pro_dbbak" successfully started.
 
Started with arguments: -backup -full
 
Recovery Manager: Release 9.2.0.6.0 - 64bit Production
[Normal] From: BMA@product_db "HP:Ultrium 1-SCSI_1_product_db"  Time: 2008-1-2 16:13:09
    STARTING Media Agent "HP:Ultrium 1-SCSI_1_product_db"
 
 
Copyright (c) 1995, 2002, Oracle Corporation.  All rights reserved.
 
[Normal] From: BMA@product_db "HP:Ultrium 1-SCSI_1_product_db"  Time: 2008-1-2 16:13:09
    Loading medium from slot 6 to device /dev/rmt/1mn
 
RMAN>
connected to target database: product_db (DBID=1065165788)
 
RMAN>
connected to recovery catalog database
 
RMAN>
RMAN> run {
2> allocate channel 'dev_0' type 'sbt_tape'
3> parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=product_db,OB2BARLIST=product_db_arch)';
4> allocate channel 'dev_1' type 'sbt_tape'
5> parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=product_db,OB2BARLIST=product_db_arch)';
6> allocate channel 'dev_2' type 'sbt_tape'
7> parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=product_db,OB2BARLIST=product_db_arch)';
8> allocate channel 'dev_3' type 'sbt_tape'
9> parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=product_db,OB2BARLIST=product_db_arch)';
10> backup incremental level 0 filesperset 4
11> format 'product_db_arch
<product_db_%s:%t:%p>.dbf'
12> archivelog all delete input
13> ;
14> }
allocated channel: dev_0
channel dev_0: sid=846 devtype=SBT_TAPE
channel dev_0: Data Protector A.05.10/209
 
……(中间略)
    Backup Statistics:
          
        Session Queuing Time (hours)      0.00       
        ----------------------------------------     
        Completed Disk Agents ........      30         
        Failed Disk Agents ...........       0         
        Aborted Disk Agents ..........       0         
        ----------------------------------------     
        Disk Agents Total  ...........      30         
        ========================================     
        Completed Media Agents .......       1         
        Failed Media Agents ..........       0         
        Aborted Media Agents .........       0         
        ----------------------------------------     
        Media Agents Total  ..........       1         
        ========================================     
        Mbytes Total ................. 29406 MB       
        Used Media Total .............       1         
        Disk Agent Errors Total ......       0

· 【文章发布信息】发表于: 2008-01-02 @ 21:49:47 · ||分类: ..experience, Working case

1 条评论 »

  1. asmboy 于 2009-04-26 @ 13:06:04 留言

    hp 800的那帮人大忽悠,不行就让他们升级case

RSS 为此帖反馈评论 · 反向跟踪 网站

留条评论