才藏太 作品数:37 被引量:62 H指数:5 供职机构: 青海师范大学 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 青海省科技厅基金 更多>> 相关领域: 自动化与计算机技术 语言文字 文化科学 更多>>
网络版班智达藏汉英电子词典的设计 被引量:7 2005年 近年来,随着计算机技术的发展,电子词典作为一种移动学习和翻译的数码工具,在国内外开始广泛地普及,其经济效益和社会效益也随之得到广大用户的关注。论文结合《班智达汉藏机器翻译系统》(国家863计划项目,编号为863-306-ZT04-05-2)的后续项目《班智达藏汉英电子词典》(国家自然科学基金,编号为69663001)的研发实践,论述了该电子词典在网络上的设计方案,重点讨论了电子词典的内容建设和结构描述以及网络中的开发模式和应用技术,最后对系统所选的平台进行了详细描述并给出了该电子词典的使用方法。 才藏太 李毛措关键词:电子词典 C/S模式 B/S模式 客户端 B+树 《班智达藏文谜语系统》的设计与实现 2010年 《班智达藏文谜语系统》是为开发藏族儿童的智力,使他们在寓教于乐的快乐环境中掌握母语知识而精心研制的智力游戏,也是藏语语言知识资源的组成部分。目前在谜语数据库中收录了1120个谜语,并设计和开发了一个游戏界面,供孩子们玩猜谜语游戏,同时可以学习母语中丰富词语和优美的表达方式。本文主要介绍了该系统所涉及的工作及意义、设计宗旨、具体实现过程和准确答案选项位置的确定等内容。 才藏太关键词:游戏 知识库 智力开发 融合多特征和注意力机制的多模态情感分析模型 被引量:4 2024年 【目的】针对当前多模态情感分析中多模态特征提取不充分,模态内部信息和模态间交互信息结合不充分的问题,提出一种融合多特征和注意力机制的多模态情感分析模型。【方法】在多模态特征提取方面,增加视频模态中人物的肢体动作、性别和年龄特征;对于文本模态,融合基于BERT的字粒度语义向量和融合义原信息的词粒度语义向量,丰富了多模态数据的低层特征。利用自注意力机制和跨模态注意力机制以实现模态内部信息和模态间信息的充分结合。将各模态特征进行拼接,通过软注意力机制为各模态特征分配注意力权重,通过全连接层输出最终的情感分类结果。【结果】在公开数据集CH-SIMS和本文构建的热点舆情评论视频数据集HPOC上与Self-MM模型对比,实验结果表明,本文模型在CH-SIMS数据集上的二分类准确率、三分类准确率和F1值分别提升1.83、1.74和0.69个百分点,在HPOC数据集上分别提升1.03、0.94和0.79个百分点。【局限】视频中人物所处的场景可能不断变化,不同的场景可能蕴含不同的情感信息,模型未考虑融合人物所处的场景信息。【结论】本文模型丰富了多模态数据的低层特征,充分结合模态内部信息和模态间信息,能够有效提升情感分析的效果。 吕学强 田驰 张乐 杜一凡 张旭 才藏太关键词:多模态 情感分析 基于网络的教务管理信息系统的设计与实现 被引量:12 2005年 随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势.本文结合笔者的硕士毕业设计项目《西北工业大学软件学院教务管理信息系统》的研发实践,论述了本系统的设计方案,包括网络拓扑结构、系统模块和数据库结构,介绍了系统所采用的软件平台和基本技术,最后说明了系统的特色所在. 才藏太关键词:C/S模式 B/S模式 客户端 数据库 基于规则的汉藏机器翻译系统中二分法的句法分析方法研究 本文结合973项目《支持舆情服务的汉藏机器翻译关键技术研究》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机... 才藏太关键词:机器翻译 语句结构 句法分析 文献传递 教务管理信息系统中客户端的设计与实现 2006年 随着校园网的普及,建立一个具有通用性、开放性、实用性和灵活性的网络教学管理体系成为可能和必然趋势。本文结合西北工业大学软件学院教务管理信息系统的研发实践,论述了本系统的设计方案、功能模块划分、操作功能和安全策略的实现。 才藏太 曹玉兰关键词:C/S模式 B/S模式 客户端 校园网 一种藏语短语自动识别系统 本发明涉及藏语短语识技术领域,且公开了一种藏语短语自动识别系统,一种藏语短语自动识别系统,藏语识别模块包括:数据预接入模块:用于从大规模藏语语料库中提取文本数据;数据预处理模块:用于将每个词语拆解为字符级别,并通过词嵌入... 才藏太 香前 索南才让融合依存句法的深度学习藏语句子分割研究 2022年 藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征,提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F_(1)值为99.4%。 头旦才让 仁青东主 尼玛扎西 完么扎西 完么扎西关键词:藏语 班智达汉藏公文翻译系统中基于二分法的句法分析方法研究 被引量:10 2005年 机器翻译系统是一种典型的自然语言处理系统,语言技术是机器翻译系统中居于核心地位的技术。本文结合863项目《班智达汉藏公文机器翻译系统》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机器翻译语法分析的效率提供了有益的方法。 才藏太 华关加关键词:人工智能 机器翻译 语句结构 句法分析 结合文本自训练和对抗学习的领域自适应工业场景文本检测 2024年 目的快速检测工业场景中的文本,可以提高生产效率、降低成本,然而数据的标注耗时耗力,鲜有标注信息可用,针对目前方法在应用到工业数据时存在伪标签质量低和域差距较大等问题,本文提出了一种结合文本自训练和对抗学习的领域自适应工业场景文本检测方法。方法首先,针对伪标签质量低的问题,采用教师学生框架进行文本自训练。教师和学生模型应用数据增强和相互学习缓解域偏移,提高伪标签的质量;其次,针对域差距,提出图像级和实例级对抗学习模块来对齐源域和目标域的特征分布,使网络学习域不变特征;最后,在两个对抗学习模块之间使用一致性正则化进一步缓解域差距,提高模型的域适应能力。结果实验证明,本文的方法在工业铭牌数据集的精确率、召回率和F1值分别达到96.2%、95.0%和95.6%,较基线模型分别提高了10%、15.3%和12.8%。同时在ICDAR15和MSRA-TD500数据集上也表现出良好性能,与当前先进的方法相比,F1值分别提高0.9%和3.1%。此外,本文的方法在应用到EAST(efficient and accurate scene text detector)文本检测模型后,铭牌数据集的各指标分别提升5%,11.8%和9.5%。结论本文提出的方法成功缓解了源域与目标域数据之间的差距,显著提高了模型的泛化能力,并且具有良好的通用性,同时模型推理阶段不会增加计算成本。 吕学强 权伟杰 韩晶 陈玉忠 才藏太关键词:领域自适应