国家自然科学基金(60872115) 作品数:12 被引量:50 H指数:4 相关作者: 万旺根 余小清 许雪琼 李昌莲 常辽豫 更多>> 相关机构: 上海大学 南昌大学 更多>> 发文基金: 国家自然科学基金 上海市教育委员会重点学科基金 上海市科委国际合作基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
一种新的自适应实时活动音频检测算法 2010年 针对音频评价系统中信号同步处理对算法准确度、复杂度、实时性等要求,提出一种简单、有效、实时的活动音频检测方法。该方法基于音频短时能量特征,通过能量均值和均方差分层逐步调整,动态设定判决门限,通过倒置非活动音频段,快速区分活动音频和非活动音频。提出的方法在低信噪比环境下也能实时地检测出活动音频。 许雪琼 余小清 万旺根 常辽豫关键词:自适应 基于改进型BP神经网络的音频多分类 被引量:4 2012年 音频信号作为多媒体信息的重要载体之一,为满足人们对信息知识的获取提供了有效途径.为了提高音频分类的精度,提出一种将音频信号的梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)参数作为特征向量,采用基于改进型传输函数的误差反向传播神经(back propagation,BP)网络模型对6种音频进行分类.实验证明,该方法在音频分类精度方面性能良好,改进的传输函数具有收敛速度快的优点.相对于传统BP算法,该方法不仅缩短了训练时间,而且进一步提高了分类精度,其分类准确率达到90%以上. 刘军伟 余小清 万旺根 张静 杨薇关键词:传输函数 BP神经网络 收敛速度 音频分类 结合图像信号显著性的自适应分块压缩采样 被引量:8 2013年 均匀分块压缩感知对图像信号进行压缩采样,无法有效地分离出重要区域和背景区域。为此,提出一种基于显著性的自适应分块压缩采样方法。根据图像信号的显著性,利用四叉树算法进行自适应图像分块,有效分离出重要区域和背景区域。根据区域块的显著度动态设置观测值数量,重要度区域设置高采样率,背景区域设置低采样率,从而提高重要区域的图像重建质量。实验分析表明,在得到更好的视觉效果同时,本文算法观测值数量较少,且重构图像的峰值信噪比(PSNR)、平均结构相似性(MSSIM)指标,以及运行时间均优于均匀分块压缩采样算法。 王瑞 余宗鑫 杜林峰 万旺根关键词:视觉显著性 自适应分块 四叉树算法 低信噪比环境下基于PR的音频分割 2010年 针对当前不同的非白噪声背景研究很少,根据噪音、语音和音乐的性质并且结合统计学理论,提出一种在不同噪声背景下低信噪比的语音/音乐分割算法。以往的检测算法很少考虑低信噪比的环境,首先从音频数据中提取新的特征参数概率密度比(probability density ratio,PR)和概率密度比过零率(probability density ratio crossing rate,PRCR),特征参数在低信噪比环境下亦能明显表征语音和音乐的不同特性,然后根据音频的特性对PRCR进行修正,再基于此修正的特征参数对语音和音乐进行改变点检测,最后得到分割结果。实验结果显示,在信噪比达到5dB时分割点准确率达到85%以上,具有良好的鲁棒性。 李昌莲 余小清 许雪琼 万旺根关键词:低信噪比 基于粗糙集理论与支持向量机的纳税评估模型 被引量:5 2009年 研究纳税评估是对纳税人纳税情况进行评价的一种管理模式。为了区分纳税人是否正常申报税款,融合了粗糙集理论与支持向量机机器学习方法的优点,提出了一种新的纳税评估模型。通过选取纳税申报表中的指标,建立纳税评估指标体系,并利用粗糙集理论对指标进行属性约简,采用支持向量机对纳税人进行分类处理,建立了纳税评估模型。最后对上述模型进行了实例验证,实验结果表明,模型具有良好的纳税评估预测性能。 刘晗 余小清 万旺根 马秀丽关键词:粗糙集 支持向量机 纳税评估 基于本体的用户兴趣模型构建研究 被引量:21 2010年 针对用户兴趣模型中本体构建和模型更新的难点和不足,提出一种基于本体论的用户兴趣模型构建方法,该方法通过领域本体、用户个性本体、校正本体和本体更新实现模型的构建。对于领域本体的构建,摒弃了训练、学习和聚类的方法,直接从开放目录专案获取类目。对于用户兴趣的更新,采用按照校正本体增加、淘汰和传递原理调整相结合的方式。实验结果表明,该模型较易生成,用户兴趣的准确度和更新的及时性都有所提高。 陈一峰 赵恒凯 余小清 万旺根关键词:本体 基于遗传算法的主题爬虫策略改进 被引量:5 2010年 针对主题爬虫存在"主题漂移"的问题,为了快速抓取网页,提出了一种基于遗传算法的主题爬行改进策略。在现有遗传算法爬行策略的基础上新引入了PageRank算法,调整了以往网页主题相关度计算方式,以计算得到的网页PageRank和相关度值为依据来选择爬行中的遗传因子,并重新设置了适应度函数,在保证优越遗传因子(与主题相关且重要网页)被优先遗传的同时,减少了遗传因子在传递过程中的"主题漂移",从而使爬行到网页的重要性和主题相关性均有所提高。与以往基于遗传算法的策略相比较,在不影响查全率的情况下,与主题相关且重要的网页数可提升5%以上。 陈一峰 赵恒凯 余小清 万旺根关键词:主题爬虫 遗传算法 网页信息 基于熵功率的手写识别系统设计 2010年 为了使语言障碍者克服障碍,通过电话等现代通信手段与其他人进行语言沟通,设计了一套实用且低成本的手写识别语音播报系统。语言障碍者在触摸屏上书写汉字字符,书写轨迹坐标经过处理转化为二值图像,再经过坐标数据的平均化、平滑处理、非线性规范、改进的Bresenham算法等预处理操作,最后调用基于熵功率的字符识别算法。字符识别完成后,将识别得到的字符编码分帧发送至TTS语音器件输出模拟音频。实验证明该系统识别准确率较高,平均达到92%,接近实际应用标准,因此该系统具有一定实用性和市场价值。 张敬林 王旭智 万旺根 吴永亮关键词:手写识别 BRESENHAM算法 基于ADV7183B的视频解码系统的设计 被引量:1 2009年 利用MSP430F169控制视频解码芯片ADV7183B处理复合视频、S-Video和色差分量的视频输入源,从而输出8 bit/16 bit CCIR656的YCrCb型4:2:2的数字视频数据,再将其进一步进行格式转换、滤波等处理,通过DVI接口显示。 王旭智 马艳茹 杨胜齐 李思关键词:数字视频 MSP430F169 视频解码 改进波形相似叠加算法的音频时长调整 被引量:2 2009年 针对波形相似叠加算法在处理高采样率音频时效率低的缺点,提出由短时均值包络到细化波形的逐步匹配方法.首先基于短时均值包络进行粗匹配,在此基础上细化包络,进行再匹配以实现音频时长调整.该算法降低了计算量,提高了运算效率.在进行音频时长调整过程中,还利用音频的优化低能量率特征参数动态调整分析窗长度,实验表明这种处理方法对混合音频的处理效果有很大改进. 许雪琼 余小清 李昌莲 万旺根