王双成
- 作品数:5 被引量:100H指数:4
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划“九五”国家攀登计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- Bayesian方法的计算学习机制和问题求解被引量:60
- 2000年
- 从信息熵的角度讨论了无信息先验分布的Bayesian假设的合理性 ,着重分析了贝叶斯方法的计算学习机制 ,得出贝叶斯定理是将先验分布中的期望值与样本均值按各自的精度进行加权平均 ,精度越高者其权值越大 ,合理地综合了先验信息和后验信息。在共轭先验分布的前提下 ,可以将后验信息作为新的一轮计算的先验 ,用 Bayesian定理与进一步得到的样本信息进行综合。多次重复这个过程后 ,样本信息的影响越来越显著。因此 ,合理正确地指派先验分布对提高学习的效率和质量有重要意义。 Bayesian方法既可避免只使用先验信息可能带来的主观偏见 ,和缺乏样本信息时的大量盲目搜索 ,也可避免只使用后验信息带来的噪音的影响。因此 ,适用于具有概率统计特征的数据采掘和知识发现问题 ,尤其是样本难得或代价昂贵的问题。
- 林士敏王双成陆玉昌
- 关键词:贝叶斯方法
- 用Bayesian网络处理具有不完整数据的问题分析被引量:17
- 2000年
- 针对现有的 Bayesian网络学习方法都不能有效处理缺失数据问题 ,论文给出了两种处理不完整数据问题的方法 :一种方法是先把不完整的数据集修复成完整的数据集 ,利用完整的数据集进行计算 ,并将结果作为不完整数据集对应情况的近似 ;另一种方法是直接使用不完整的数据集进行近似计算 ,而这种近似计算是渐进正确的。实验结果表明前一种方法计算结果准确 ,但效率较低 ;后一种方法效率较高 ,在数据量比较大时能达到很好的效果 ;而且这两种方法的性能比其它处理缺失数据的方法效果要好。
- 王双成林士敏陆玉昌
- 关键词:贝叶斯网络不完整数据数据处理
- 贝叶斯网络结构学习分析被引量:19
- 2000年
- 贝叶斯网络结构学习(以下简称结构学习)的目标是寻找对先验知识和数据拟合得最好的网络结构。结构学习有两种方式,一种是模型选择,即选择一个最好的网络结构;另一种是选择性的模型平均,即选择合适数量的网络结构,以这些网络结构代表所有的网络结构。
- 王双成林士敏陆玉昌
- 关键词:贝叶斯网络
- 用贝叶斯网络进行因果分析被引量:12
- 2000年
- 因果分析是贝叶斯网络的一个重要应用领域。因果分析不同于相关分析,无论对数据分析、扰动分析还是预测都是十分重要的。贝叶斯网络虽然有一定的因果语义(我们常常用变量的因果关系构造贝叶斯网络结构),但贝叶斯网络是条件独立性的表示,因此我们不能不加限定地用贝叶斯网络进行因果分析。
- 王双成林士敏陆玉昌
- 关键词:贝叶斯网络
- Sybase多表复杂关联数据的传输被引量:1
- 2000年
- 讨论了多表复杂关联数据的传输问题,给出了避免传输错误的有效方法。
- 王双成鲁明羽陆玉昌
- 关键词:数据完整性数据传输SYBASE数据库