哪位老大有smit hacmpp的经验,请帮忙

个为老大,我刚刚接触hacmp,遇到问题对日志看不太懂,请老大们给讲讲日志里两台机器在做什么。个为老大,我刚刚接触hacmp,遇到问题对日志看不太懂,请老大们给讲讲日志里两台机器在做什么。附件: (53.13 KB)回答邀答的回答&
, 北京南天软件有限公司关键信息LABEL:& && && & GS_DOM_MERGE_ERIDENTIFIER:& &&&9DEC29E1Date/Time:& && & Sun Nov 22 16:36:34 CST 2009Sequence Number: 1562Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&OType:& && && && &PERMResource Name:& &grpsvcs& && && &DescriptionGroup Services daemon exit to merge domainsProbable CausesNetwork between two node groups has repairedFailure CausesNetwork communication has been blocked.Topology Services has been partitioned.& && &&&Recommended Actions& && &&&Check the network connection.Check the Topology Services.Verify that Group Services daemon has been restartedCall IBM Service if problem persistsDetail DataDETECTING MODULERSCT,NS.C,1.107.1.35,4370& && && && && && && &ERROR ID 6Vb0vR0mnP09/olj0C4.2g0...................REFERENCE CODE& && && && && && && && && && && && && && &DIAGNOSTIC EXPLANATIONThe master requests to dissolve my domain because of the merge with other domain 1.10以下是errpt日志截图LABEL:& && && & ERRLOG_ONIDENTIFIER:& &&&9DBCFDEEDate/Time:& && & Mon Nov 23 09:12:20 CST 2009Sequence Number: 1568Machine Id:& && &00CF884D4C00Node Id:& && && &localhostClass:& && && &&&OType:& && && && &TEMPResource Name:& &errdemon& && &&&DescriptionERROR LOGGING TURNED ONProbable CausesERRDEMON STARTED AUTOMATICALLYUser Causes/USR/LIB/ERRDEMON COMMAND& && &&&Recommended Actions& && &&&NONE---------------------------------------------------------------------------LABEL:& && && & OPMSGIDENTIFIER:& &&&AA8AB241Date/Time:& && & Sun Nov 22 16:36:35 CST 2009Sequence Number: 1567Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&OType:& && && && &TEMPResource Name:& &OPERATOR& && &&&DescriptionOPERATOR NOTIFICATIONUser CausesERRLOGGER COMMAND& && &&&Recommended Actions& && &&&REVIEW DETAILED DATADetail DataMESSAGE FROM ERRLOGGER COMMANDclexit.rc : Unexpected termination of clstrmgrES---------------------------------------------------------------------------LABEL:& && && & SRC_SVKOIDENTIFIER:& &&&BC3BE5A3Date/Time:& && & Sun Nov 22 16:36:34 CST 2009Sequence Number: 1566Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&SType:& && && && &PERMResource Name:& &SRC& && && && & DescriptionSOFTWARE PROGRAM ERRORProbable CausesAPPLICATION PROGRAMFailure CausesSOFTWARE PROGRAM& && &&&Recommended Actions& && &&&MANUALLY RESTART SUBSYSTEM IF NEEDEDDetail DataSYMPTOM CODE& && &&&1024SOFTWARE ERROR CODE& && & -9017ERROR CODE& && && &&&0DETECTING MODULE'srchevn.c'@line:'350'FAILING MODULEclstrmgrES---------------------------------------------------------------------------LABEL:& && && & SRC_RSTRTIDENTIFIER:& &&&BA431EB7Date/Time:& && & Sun Nov 22 16:36:34 CST 2009Sequence Number: 1565Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&SType:& && && && &PERMResource Name:& &SRC& && && && & DescriptionSOFTWARE PROGRAM ERRORProbable CausesAPPLICATION PROGRAMFailure CausesSOFTWARE PROGRAM& && &&&Recommended Actions& && &&&VERIFY SUBSYSTEM RESTARTED AUTOMATICALLYDetail DataSYMPTOM CODE& && && &&&0SOFTWARE ERROR CODE& && & -9035ERROR CODE& && && &&&0DETECTING MODULE'srchevn.c'@line:'217'FAILING MODULEemsvcs---------------------------------------------------------------------------LABEL:& && && & SRC_SVKOIDENTIFIER:& &&&BC3BE5A3Date/Time:& && & Sun Nov 22 16:36:34 CST 2009Sequence Number: 1564Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&SType:& && && && &PERMResource Name:& &SRC& && && && & DescriptionSOFTWARE PROGRAM ERRORProbable CausesAPPLICATION PROGRAMFailure CausesSOFTWARE PROGRAM& && &&&Recommended Actions& && &&&MANUALLY RESTART SUBSYSTEM IF NEEDEDDetail DataSYMPTOM CODE& && &&&2560SOFTWARE ERROR CODE& && & -9017ERROR CODE& && && &&&0DETECTING MODULE'srchevn.c'@line:'350'FAILING MODULEgrpsvcs---------------------------------------------------------------------------LABEL:& && && & HA002_ERIDENTIFIER:& &&&12081DC6Date/Time:& && & Sun Nov 22 16:36:34 CST 2009Sequence Number: 1563Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&SType:& && && && &PERMResource Name:& &haemd& && && &&&DescriptionSOFTWARE PROGRAM ERRORProbable CausesSUBSYSTEMFailure CausesSUBSYSTEM& && &&&Recommended Actions& && &&&REPORT DETAILED DATA& && &&&CONTACT APPROPRIATE SERVICE REPRESENTATIVEDetail DataDETECTING MODULELPP=PSSP,Fn=emd_gsi.c,SID=1.4.1.36,L#=1361,& && && && && && && && && && && && & DIAGNOSTIC EXPLANATIONhaemd:
Cannot dispatch group services (1).---------------------------------------------------------------------------LABEL:& && && & GS_DOM_MERGE_ERIDENTIFIER:& &&&9DEC29E1Date/Time:& && & Sun Nov 22 16:36:34 CST 2009Sequence Number: 1562Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&OType:& && && && &PERMResource Name:& &grpsvcs& && && &DescriptionGroup Services daemon exit to merge domainsProbable CausesNetwork between two node groups has repairedFailure CausesNetwork communication has been blocked.Topology Services has been partitioned.& && &&&Recommended Actions& && &&&Check the network connection.Check the Topology Services.Verify that Group Services daemon has been restartedCall IBM Service if problem persistsDetail DataDETECTING MODULERSCT,NS.C,1.107.1.35,4370& && && && && && && &ERROR ID 6Vb0vR0mnP09/olj0C4.2g0...................REFERENCE CODE& && && && && && && && && && && && && && &DIAGNOSTIC EXPLANATIONThe master requests to dissolve my domain because of the merge with other domain 1.10---------------------------------------------------------------------------LABEL:& && && & GOENT_RCVRY_EXITIDENTIFIER:& &&&F3931284Date/Time:& && & Sun Nov 22 16:36:28 CST 2009Sequence Number: 1561Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&HType:& && && && &INFOResource Name:& &ent5& && && && &Resource Class:&&adapterResource Type:& &Location:& && &&&UB0FGG-P2-C06-T1VPD:& && && && & & && &&&Product Specific.(&&).......10/100/1000 Base-TX PCI-X Adapter& && &&&Part Number.................03N6524& && &&&FRU Number..................03N6524& && &&&EC Level....................H14006 & && &&&Manufacture ID..............YL1021& && &&&Network Address.............AF& && &&&ROM Level.(alterable).......GOL021DescriptionETHERNET NETWORK RECOVERY MODE& && &&&Recommended Actions& && &&&PERFORM PROBLEM DETERMINATION PROCEDURESDetail DataFILE NAMEline: 204 file: goent_intr.cPCI ETHERNET STATISTICS00C4 44C2 00 00 00 00
7E 3F51 E47 00 3C 57D5 070D C054 3C DCFB
B4FF 00 00 93 00 00 00 18 00 0000 00 00 0000 BB83 00F0
C9E1 00 00 00 0000 00 0000 DEVICE DRIVER INTERNAL STATE00 00 SOURCE ADDRESS 70AF ---------------------------------------------------------------------------LABEL:& && && & GOENT_RCVRY_EXITIDENTIFIER:& &&&F3931284Date/Time:& && & Sun Nov 22 16:36:28 CST 2009Sequence Number: 1560Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&HType:& && && && &INFOResource Name:& &ent3& && && && &Resource Class:&&adapterResource Type:& &Location:& && &&&UB0FK5-P2-C06-T1VPD:& && && && & & && &&&Product Specific.(&&).......10/100/1000 Base-TX PCI-X Adapter& && &&&Part Number.................03N6524& && &&&FRU Number..................03N6524& && &&&EC Level....................H14006 & && &&&Manufacture ID..............YL1021& && &&&Network Address.............B9& && &&&ROM Level.(alterable).......GOL021DescriptionETHERNET NETWORK RECOVERY MODE& && &&&Recommended Actions& && &&&PERFORM PROBLEM DETERMINATION PROCEDURESDetail DataFILE NAMEline: 204 file: goent_intr.cPCI ETHERNET STATISTICS00C4 44C2 00 00 00 00
6D C341 E4E 00 306D EEAB 003C 57D4 070D BF56 BA6 E691
FE0A 110B 00 01
00 00 00 24 00 0000 00 00 0000 BB83 00F0
C9E1 00 00 00 0000 00 0000 DEVICE DRIVER INTERNAL STATE00 00 SOURCE ADDRESS 92B9 ---------------------------------------------------------------------------LABEL:& && && & TS_LOC_DOWN_STIDENTIFIER:& &&&173C787FDate/Time:& && & Sun Nov 22 16:24:02 CST 2009Sequence Number: 1559Machine Id:& && &00CF884D4C00Node Id:& && && &node83f884dClass:& && && &&&SType:& && && && &INFOResource Name:& &topsvcs& && && &DescriptionPossible malfunction on local adapterProbable CausesLocal adapter mal-functionedLocal adapter lost connection to networkLocal adapter mis-configuredFailure CausesLocal adapter mal-functionedLocal adapter lost connection to networkLocal adapter mis-configured& && &&&Recommended Actions& && &&&Verify adapter configuration& && &&&Verify network connectivityDetail DataDETECTING MODULErsct,nim_control.C,1.39.1.10,4865& && && && & ERROR ID 6zV5DL.0cP09/Qqp/C4.2g0...................REFERENCE CODE& && && && && && && && && && && && && && &Adapter interface nameen5Adapter offset& && && &&&1Adapter IP address192.168.100.1赞同浏览100技术总监, 北京南天软件有限公司关注评论70新手园地& & & 硬件问题Linux系统管理Linux网络问题Linux环境编程Linux桌面系统国产LinuxBSD& & & BSD文档中心AIX& & & 新手入门& & & AIX文档中心& & & 资源下载& & & Power高级应用& & & IBM存储AS400Solaris& & & Solaris文档中心HP-UX& & & HP文档中心SCO UNIX& & & SCO文档中心互操作专区IRIXTru64 UNIXMac OS X门户网站运维集群和高可用服务器应用监控和防护虚拟化技术架构设计行业应用和管理服务器及硬件技术& & & 服务器资源下载云计算& & & 云计算文档中心& & & 云计算业界& & & 云计算资源下载存储备份& & & 存储文档中心& & & 存储业界& & & 存储资源下载& & & Symantec技术交流区安全技术网络技术& & & 网络技术文档中心C/C++& & & GUI编程& & & Functional编程内核源码& & & 内核问题移动开发& & & 移动开发技术资料ShellPerlJava& & & Java文档中心PHP& & & php文档中心Python& & & Python文档中心RubyCPU与编译器嵌入式开发驱动开发Web开发VoIP开发技术MySQL& & & MySQL文档中心SybaseOraclePostgreSQLDB2Informix数据仓库与数据挖掘NoSQL技术IT业界新闻与评论IT职业生涯& & & 猎头招聘IT图书与评论& & & CU技术图书大系& & & Linux书友会二手交易下载共享Linux文档专区IT培训与认证& & & 培训交流& & & 认证培训清茶斋投资理财运动地带快乐数码摄影& & & 摄影器材& & & 摄影比赛专区IT爱车族旅游天下站务交流版主会议室博客SNS站务交流区CU活动专区& & & Power活动专区& & & 拍卖交流区频道交流区
白手起家, 积分 16, 距离下一级还需 184 积分
论坛徽章:0
请mail给小弟一份,谢谢!
&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp&&nbsp|&&nbsp
稍有积蓄, 积分 250, 距离下一级还需 250 积分
论坛徽章:0
各位大侠有hacmp的中文资料吗?
用google就能搜索到一大堆
哪天我准备个口袋等着大家给我装钱进来
白手起家, 积分 16, 距离下一级还需 184 积分
论坛徽章:0
各位大侠有hacmp的中文资料吗?
老大,你有的话,给我发一份.
家境小康, 积分 1219, 距离下一级还需 781 积分
论坛徽章:0
各位大侠有hacmp的中文资料吗?
借你个碗好了
白手起家, 积分 16, 距离下一级还需 184 积分
论坛徽章:0
各位大侠有hacmp的中文资料吗?
不会吧,你干脆多借一点.赫赫.
白手起家, 积分 64, 距离下一级还需 136 积分
论坛徽章:0
各位大侠有hacmp的中文资料吗?
学习要主动HTTP/1.1 新建会话失败HACMP5.x完全手册之脚本设计和经验共享(4)
用圣才电子书APP或微信扫一扫,在手机上阅读本文,也可分享给你的朋友。
HACMP 的 DMS 问题的修正
DMS(deadman switch) 是用来描述系统 kernel extension 用的,它可以在系统崩溃前关闭系统,并产生 dump 文件,以供日后检查使用。
DMS 存在的目的是为了保护共享外置硬盘及数据,当系统挂起时间长过一定限制时间时,DMS 会自动关闭该系统,由 HACMP 的备份节点接管系统,以保护数据和业务的正常进行,避免潜在的问题,特别是外置磁盘阵列。
errpt 确认 DMS 的发生:
LABEL:     KERNEL_PANIC
IDENTIFIER:   225E3B63
Date/Time:    Thu Apr 25 21:26:16
Sequence Number: 609
Machine Id:   C00
Node Id:     localhost
Class:      S
Type:      TEMP
Resource Name:  PANIC
Descrīption
SOFTWARE PROGRAM ABNORMALLY TERMINATED
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
ASSERT STRING
PANIC STRING
DMS 起作用的原因主要有以下几点:
某种应用程序的优先级大于 clstrmgr deamon , 导致 clstrmgr 无法正常重置 DMS 计数器;
在系统上存在大量 I/O 操作,导致 CPU 没有时间相应 clstrmgr deamon;
内存泄漏或溢出问题;
大量的系统错误日志活动。
换句话说,当以上情况出现时,HACMP 认为系统崩溃,会自动切换到另一台节点机上去,这是我们想要的结果吗?
一般情况下,原有的缺省设置无需更改。但由于系统运行了较长时间后,负荷可突破原有设计(平均小于 45%),而且某些情况下会持续 100%,我们就不希望发生切换。如果发生了 DMS 造成的切换,我们先延长 HACMP 的确认的时间,即调整心跳线的 诊断频率 :
Change a Network Module using Predefined Values 选择 r232
* Network Module Name rs232
Description RS232 Serial Protocol
Failure Detection Rate Slow
NOTE: Changes made to this panel must be
propagated to the other nodes by
Verifying and Synchronizing the cluster
同样,记得同步 HACMP。
如果还是发生 DMS 导致的 HACMP 切换,排除异常后,只好禁用 DMS 了, 这点 IBM 不推荐,因为有可能造成切换时数据丢失或损坏。
修改 rc.cluster 文件增加 -D 参数:
vi /usr/es/sbin/cluster/etc/rc.cluster
if [ &$VERBOSE_LOGGING& = &high& ]
clstart -D -smG $CLINFOD $BCAST
/dev/console
重起 HACMP 生效。
SNMP 的调整(AIX5.3 不需要)
在 AIX 5.2 下要对 SNMP 做一些调整才可以看到真正的 HACMP 的状态。
具体来说, AIX 5.2 的 SNMP 默认是 version 3 :
ls -l |grep snmp
-rwxr-x--- 1 root system 83150 Mar 12 2003 clsnmpne
-rwxr-x--- 1 root system 55110 Mar 12 2003 pppsnmpd
而 HACMP 只支持 SNMP version 1 . 所以我们要做一下调整:
stopsrc -s snmpd
/usr/sbin/snmpv3_ssw -1
startsrc -s snmpd
ls -l |grep snmp
/usr/sbin/clsnmpne
-rwxr-x--- 1 root system 83150 Mar 12 2003 clsnmpne
-rwxr-x--- 1 root system 55110 Mar 12 2003 pppsnmpd
/usr/sbin/snmpdv1
本部分论述了富有特色的 HACMP 脚本编著,也就特殊情况下的一些 HACMP 场景的处理做了详尽的描述,相信对希望进一步深入掌握 HACMP 的读者会有所帮助,对现实工作具有较强的参考意义。总的来说,本文采用类似教程的方式,一步一步由浅入深,细致完整的描述了 IBM HACMP 实施的各个方面,是不可多得的 HACMP 的使用手册。
作者:不详&来源:网络
小编工资已与此赏挂钩!一赏一分钱!求打赏↓ ↓ ↓
如果你喜欢本文章,请赐赏:
已赐赏的人
我的电子书}

我要回帖

更多关于 aix hacmp 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信