搜索到2316篇“ LDA模型“的相关文章
基于LDA模型的ChatGPT文献计量分析
2024年
阐述依据某数据库提供的710条文献数据,使用隐性狄利克雷分布机器学习算法,以文献摘要文本为数据集挖掘主题,归纳3个当前ChatGPT相关的热点研究方向。对每个主题进行分析解读后,提出完善人工智能治理体系,规范使用人工智能技术和摆正ChatGPT的知识生产角色的建议。
胡乐天姜娟潘伊芸杨欣晨
关键词:智能技术LDA模型文本挖掘
基于LDA模型的文本时间窗口划分研究被引量:1
2024年
[目的/意义]鉴于静态主题模型难以满足用户动态分析需求,为解决现有动态主题模型存在计算成本高或者受主观因素影响深等问题,从时间窗口相似度出发,以LDA模型为基础,提出一种文本时间窗口划分算法。[方法/过程]构建集时间窗口间差异性和时间窗口内一致性于一体的时间窗口相似度指标,基于该指标构建文本时间窗口划分算法,并以创新研究领域为例开展实证研究。[结果/结论]综合每一个时间窗口内最优主题个数下主题之间的平均JS散度和相邻时间窗口间不同主题之间的平均JS散度两个指标结果来看,使用本文提出的算法得出的划分结果明显优于多种固定时间窗口长度划分的结果,验证了本研究提出的文本时间窗口划分算法的有效性。该算法在一定程度上解决了现有动态主题模型计算成本高、主观性强等缺点,增加了文本时间窗口划分结果的客观性与准确性,可以为主题演化等相关研究提供技术支持。
龙艺璇王晓刚周子威王荣笙伊惠芳
关键词:LDA模型文本相似度
基于LDA模型的国外潜艇声呐研究主题分析
2024年
本文基于科学引文索引,检索了1108篇与“潜艇声呐”主题紧密相关的国外文献作为数据源。采用LDA主题建模技术,精确识别了六大核心主题:声呐技术与应用、声呐与机器人技术、声呐探测系统与应用、水下通信与导航、反潜作战领域的声呐技术、声呐与人工智能。基于这些主题,对原始数据进行了系统性的分类汇总与深入分析。本研究旨在通过深度剖析当前国外文献的研究焦点与趋势,为相关领域的研究者提供快速掌握领域发展脉络的途径。此举不仅有助于我国研究人员精准定位未来研究方向,更将积极促进我国潜艇声呐技术的进步与海洋强国战略的发展。
崔丹李赫陈鹏
关键词:LDA主题建模主题挖掘
基于LDA模型的元宇宙主题挖掘与演化
2024年
检索WoS核心数据库关于元宇宙文献(保留文献的摘要部分),依靠Python进行LDA(潜在狄利克雷分配)模型构建,通过困惑度以及主题一致性确定最佳主题数,并抽取文本下词频最高的11个主题,对元宇宙相关文献进行主题抽取与挖掘,运用WordCloud技术、桑基图(主题相似度)进行主题演化分析,从而了解元宇宙发展状态以及演化趋势。结果表明:目前关于元宇宙的研究主要在“元宇宙技术”和“元宇宙应用”方面,词云分析中关键词“tech-nolog”以及“virtual”较为突出;从主题热度分析来看,主题4(教育元宇宙研究)、主题7(元宇宙技术研究)、主题8(元宇宙应用研究)是目前元宇宙研究的热点;从主题演化分析来看,第1阶段(2018—2022年)中主题2元宇宙模型研究和主题8元宇宙技术研究表现出较强的演化能力,第2阶段(2023—2024年)的主题4元宇宙体验研究和主题8元宇宙场景构建研究演化能力强,且与相邻主题相似性高。
陈加元刘彦
关键词:主题挖掘
一种基于词加权LDA模型的恶意文件检测方法被引量:1
2024年
恶意文件中往往含有出现频率较低、但表征能力更好的特征码,传统的方法未能将这一类特征提取出来。针对该问题,提出一种基于词加权LDA模型的恶意文件检测方法,该方法通过反汇编对样本进行预处理,采用改进的KeyGraph算法(IKG)提取“重点词”,这类词具有更好的特征表征能力,再利用优化的点互信息(OPMI),算出各“重点词”权重,构建词字典,然后将该词加权方法扩展到LDA模型,建立IKG-OPMI-LDA(IOL)模型完成分类,并采用Gibbs Sampling进行参数估计。实验结果表明,相较于其他方法,该方法的分类准确率有明显提高,分类效率更好,并且提取的特征具有更高的区分度,与主题相关度更高。
徐建国王旭阳
关键词:LDA文档分类
改进LDA模型在影视作品推荐中的应用研究被引量:1
2024年
为了解决影视资源推荐精度问题,引入隐含狄利克雷分布(LDA)完成对影视作品影评数据分析。考虑LDA无法体现各特征词重要性,将注意力机制嵌入网络,提高模型精度。结果显示,在推荐准确率测试中,以MoviesLens-1M数据进行测试,所提出模型准确率为0.936,相对同类推荐技术精度最好。由此可见,所提出推荐模型在系统稳定性、推荐效果上均有出色效果。
申菲
关键词:影视作品LDA
基于LDA模型的国内用户画像研究主题及演化分析
2024年
【目的/意义】旨在发现国内用户画像研究领域的研究主题以及这些主题的发展脉络,为图书馆用户画像的构建提供参考。【方法/过程】运用LDA主题模型对国内用户画像研究论文的题目、摘要和关键词等内容进行文本挖掘,按年度对热点主题进行分析并发现各主题的演化趋势。【结果/结论】国内用户画像研究领域大体可划分为8个研究主题:新媒体营销、电商系统与精准营销、推荐算法与推荐系统、健康信息服务、教育教学、金融服务、社交网络与内容分析、高校图书馆与信息服务。研究主题按年度演化趋势可分为上升主题、平稳主题和衰减主题3类。高校图书馆与信息服务是上升幅度最大的主题,这表明研究人员越来越关注用户画像在图书馆及相关领域的应用研究。
王一博张鹏翼
关键词:图书馆
基于LDA模型的中国大气污染治理政策主题演进分析
2024年
中国的大气污染治理政策自颁布伊始距今已有41年(1979—2019年),以此作为研究背景,将我国大气污染治理政策划分为三个时期。运用困惑度计算各个时期的主题数目,使用R软件构建隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型进行主题标识及关键词强度的计算,研究发现政策内容由单一污染物、污染源主题演变为多污染物、污染源的治理主题;政策工具的主题演变体现了我国大气污染治理的多样化;重要事件驱动了我国大气污染治理政策的演变。
王源翟广宇
关键词:大气污染LDA模型
基于LDA模型和意象图式的产品隐喻设计方法研究
2024年
目的为实现隐喻设计方法的喻体选择和隐喻转译,结合LDA模型和意象图式提出一种新型产品隐喻设计方法。方法应用LDA聚类分析始源域中事件的情绪体验,获取用户在始源域中的主题喻体。基于深度访谈和图式表征分析提取意象图式,并通过AHP评价排序获取重要图式转译因子。将图式因子进行组合表述,联想产品相应功能特征,完成意象喻体到产品主体的转译。结果以减压产品为例进行设计实践,通过LDA聚类获取了感官放松、情感满足、体验良性发展、探索未知、无意识本能、体能释放六大主题与相应模态,以及与主题对应的图示因子,并以可视化桌面蓝牙音箱为设计载体,从视觉、听觉和触觉模态介入,结合图式联想完成了音乐播放、探索互动、自动休眠和情绪释放4个功能隐喻设计。利用加权算法对设计方案进行测试评估,验证了设计方法的合理性。结论从隐喻设计现状出发,探索了基于LDA模型和意象图式的产品隐喻设计方法并加以实践,验证理论与方法的可行性与有效性,为产品隐喻设计乃至其他情感价值类产品的设计研究提供了优质案例与借鉴。
侯士江卫建君孙宇辰鲁莹王佳棋廉博杰
关键词:产品设计LDA模型意象图式
基于LDA模型与政策工具的中国数据主权政策研究被引量:1
2024年
在数字经济发展与总体国家安全观的双重时代背景下,数据主权已成为国家主权的重要组成部分。各主要国家和地区积极开展数据主权战略部署,在数据资源、数据技术和数据规则方面展开激烈竞争与博弈。文章采用政策文本分析方法研究我国数据主权政策,运用LDA(Latent Dirichlet Allocation)主题模型和政策工具量化分析中国数据主权政策的过程演化、主题特征,并综合考虑全球数据主权态势,提出4条政策建议:积极主导和参与国际规则制定;优化数据出境安全评估流程;完善个人信息出境标准合同模版;强化数据安全法治保障。
乔晗徐君如
关键词:数据安全LDA模型

相关作者

李湘东
作品数:53被引量:287H指数:9
供职机构:武汉大学信息管理学院
研究主题:文本分类 LDA模型 书目信息 非人灵长类动物 LDA
段红梅
作品数:84被引量:583H指数:14
供职机构:北京中医药大学护理学院
研究主题:儿童 哮喘 共词分析 聚类分析 文献计量学
黄莉
作品数:20被引量:137H指数:8
供职机构:武汉大学动力与机械学院
研究主题:文本分类 LDA模型 书目信息 数字图书馆 语料库
唐晓波
作品数:146被引量:1,441H指数:22
供职机构:武汉大学信息管理学院
研究主题:本体 情感分析 LDA 社会化媒体 知识服务
曹洁
作品数:370被引量:1,085H指数:15
供职机构:兰州理工大学
研究主题:粒子滤波 故障诊断 目标跟踪 明胶生产 调度问题