国家自然科学基金(61371142)
- 作品数:40 被引量:120H指数:6
- 相关作者:王景中曾凡锋童立靖肖珂李萌更多>>
- 相关机构:北方工业大学大连大学黄工机械集团有限公司更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术化学工程更多>>
- 无限狄利克雷混合模型的变分学习
- 2017年
- 有限高斯混合模型广泛应用于模式识别、机器学习和数据挖掘等领域,但现实中的许多数据都具有非高斯性,而高斯混合模型无法准确地描述这些数据。此外,有限高斯混合模型还存在参数估计和模型选择困难的问题。为了更好地拟合非高斯数据,解决有限高斯混合模型的参数估计和模型选择困难的问题,在研究一种适合于建模非高斯数据的无限狄利克雷混合模型的学习方法的基础上,提出了一种高效的变分近似推理算法。该算法能够同时解决参数估计及模型选择的问题。为了验证该算法的有效性,在合成数据集上进行了大量实验。验证实验结果表明,该算法能够很好地解决模型选择及参数估计的问题。所提出的无限狄利克雷混合模型还可应用于目标检测、文本分类、图像分类等方面。
- 曾凡锋陈可王宝成肖珂
- 关键词:狄利克雷参数估计
- 基于SVM的复杂版面分割方法
- 2018年
- 对文本图像的灰度、纹理、相位一致性等关键特征进行了较为全面的分析,研究出版面中文字、图像等区域在各种特征层面上的差异。针对具有复杂版面的图像,选取图像的纹理特征和相位一致性统计特征,借助SVM对图像进行版面分割。该方法提取出的特征向量可以有效地区分图像中各类不同的区域。比传统的版面分割方法更为有效,具有较强的应用价值。
- 曾凡锋许博臣
- 关键词:版面分割特征提取支持向量机
- 中英文混排扭曲文本图像快速校正方法被引量:1
- 2015年
- 针对OCR在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行,得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒;然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果,校正后图像OCR识别率有明显提高。
- 王景中孙婷童立靖
- 关键词:字符切分
- 三维书籍模型的单侧页面提取方法
- 2017年
- 针对目前点云分割方法较难分割三维书籍模型的情况,提出一种快速有效的单侧书籍页面的自动提取方法。对于获取的三维书籍模型,利用模型的点云深度信息,求出背景平面方程,去掉模型背景,保留书籍区域;通过分析书籍模型的形态特性,求出分割左右页面的空间平面,保留其中一侧页面;根据点云的密度分布去掉页面的书口区域点云,得到单侧页面的三维模型。实验结果表明,该方法能够快速稳定地提取出单侧页面,具有较高的准确性和速度性能。
- 童立靖李斌
- 关键词:点云分割最小二乘法
- 基于双线性模型的图像检索技术被引量:3
- 2019年
- 为尽可能保留图像的有效信息,解决在传统的基于深度哈希的图像检索方法中,单一的信息流网络结构设计可能引发的部分图像信息缺失的问题,提出一种采用双线性模型网络结构的图像检索方法。两条并行的信息流能够充分对图像信息进行筛选并保留图像的有效信息,在后续的卷积过程中这些有效的图像信息可以得到充分融合,实现改善图像检索效果的目的。CIFAR-10和MNIST数据集上的实验结果表明,该方法相较现有基于深度哈希的图像检索方法有更好的图像检索效果。
- 曾凡锋胡胜达付国涛
- 关键词:图像检索卷积神经网络
- 灰度文本图像的扭曲文本行信息检测提取
- 2017年
- 文本行的检测提取是文本图像分析的支柱。这里提出一种新的扭曲文本行信息检测提取方法,直接从灰度图像进行文本行的检测。首先用高斯平滑滤波增强文本行的结构,然后用脊线检测找出文本行的中心线,在脊线的基础上用自适应主动轮廓模型来估算出文本行的边缘线。理论分析和实验结果表明,该算法检测文本行边缘线的精确度较好,而且具有一定的鲁棒性和较好的适应性。
- 王景中王兆亮
- 关键词:主动轮廓模型
- Retinex在光照不均文本图像中的研究被引量:9
- 2017年
- 为提高文本图像在光照不均条件下的OCR识别率,提出一种基于Retinex的光照不均校正方法。采用分块Otsu二值化减弱光照不均的影响程度,分析其得到的二值图像,判断光照情况并获得光照不均图像块,利用改进的Retinex方法对光照不均图像块进行重新处理,采用Sauvola二值化得到清晰的校正图像。实验结果表明,该算法能很好地消除光照不均的影响,取得较好的二值图像,在各式样本以及不同光照情况下都有较高的OCR识别率。
- 曾凡锋刘树鹏
- 关键词:光照不均RETINEX理论二值化
- 一种基于页眉线的扭曲文档图像快速校正方法
- 2016年
- 在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显,对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR识别率大幅度提高。
- 曾凡锋段漾波
- 关键词:计算机应用图像校正
- 基于文本域分割和文本行检测的扭曲文档图像校正
- 2015年
- 针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要。文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别。
- 张再银童立靖湛健沈冲
- 基于纹理的三维书籍模型单侧页面提取方法
- 2018年
- 模型分割在实际工程中有重要的应用价值。针对三维书籍模型的点云分割,提出了一种基于纹理的单侧书籍页面提取方法。对于获取的三维书籍模型以及散乱纹理图像,首先将模型的散乱纹理转化为有序纹理,将像素值从RGB空间转换到HSI空间,根据H(色调)和I(亮度)去掉模型背景点云;然后根据书脊线像素在有序纹理图像中的分布特性,计算纹理图像中的书脊线,再利用最小二乘法拟合出书脊线的三维空间方程,进而求出分割左右页面的空间平面,最终完成单侧页面的提取。实验结果表明,该方法针对三维书籍模型能够快速稳定地提取出单侧页面,具有较高的准确性。
- 童立靖王凤鹤李斌
- 关键词:点云分割HSI色彩空间最小二乘法