论文摘要:自主计算环境中相关性模型的研究与实现
随着Internet网络技术和Internet应用及服务技术的快速发展,大规模分布式网络应用技术越来越庞大、复杂,对于管理人员的需求也在不断的增加。在这种背景下,IBM公司提出自主计算的概念,目的是使用技术来管理技术,尽量减少人为干预。论文工作主要针对自主计算中的故障定位。首先介绍了分布系统中故障定位技术的研究现状。分析了相关性模型在分布式故障管理中的应用,以及贝叶斯网络的相关研究,提出了应用贝叶斯网络来表示相关性模型,应用于分布式系统的故障管理。然后研究了基于贝叶斯网络的相关性模型构造方法:静态分析构造方法和基于故障注入的主动建模方法。描述了构造系统的实现框架。系统实现了两大功能:贝叶斯网络学习和故障注入。接下来,论文分别描述了贝叶斯网络学习和故障注入的设计和实现。贝叶斯网络学习是在贝叶斯网络构造算法实现的基础上实现的,系统中实现了两种贝叶斯网络构造算法:K2算法和三阶段算法。故障注入是针对分布式系统的建模需求建立的,它可以加速贝叶斯网络学习的训练数据积累,从而实现快速建模。最后,论文在自主管理环境以及一个典型的基于分布式环境的电子商务环境中,分别验证了相关性模型两种构造方法,在实践中验证了相关性模型构造方法的准确性,并对下一步的研究方向进行了探讨。