郭玉林
- 作品数:1 被引量:0H指数:0
- 供职机构:黑龙江大学计算机科学技术学院更多>>
- 发文基金:国家自然科学基金黑龙江省教育厅科学技术研究项目黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 频繁子图挖掘算法gSpan的设计与实现
- 2011年
- 由于大部分图挖掘算法都需要利用频繁子图,频繁子图挖掘逐渐成为了数据挖掘领域中的热点研究内容。目前,很多高效的频繁子图挖掘算法已经被提出。其中,gSpan算法是目前公认的最好的频繁子图挖掘算法。然而,在化合物数据集上,还可以利用化合物的特殊结构进一步优化gSpan算法的性能。文献利用了化合物分子结构的对称性和原子类型分布的不均衡性,提出了一些新的优化策略,进一步改进了gSpan的性能。鉴于gSpan算法在图挖掘领域乃至整个数据挖掘领域的重要性,设计并实现gSpan算法。同时,采用文献[4]中的优化策略,进一步提高gSpan算法在化合物数据集上的运行效率。
- 郭玉林刘勇
- 关键词:频繁子图