搜索到1090篇“ 中文文本分类系统“的相关文章
面向合同领域的中文文本分类系统的研究与实现
随着信息技术的飞速发展,企业进入信息化时代,合同签订模式趋于多元化,与此同时,海量合同管理问题日益严重。相较于过去合同管理模式,主要依靠人工阅读理解方式,这导致合同分非常耗时耗力,而且缺乏统一的分标准,为了提升企业办...
孙铭泽
关键词:合同领域中文文本分类
基于改进的TextCNN模型的中文文本分类系统
2021年
随着互联网的快速发展,网络上的信息呈现出爆炸式的增长。面对这些海量的信息数据,如何进行快速的文本分类就显得非常的重要。为了实现本的快速分,针对多文本分类的问题提出并设计了一种基于改进的TextCNN模型的中文文本分类模型,即Bert-TextCNN-Highway模型。基于此模型,在明确了相应系统需求的基础上,对系统的设计与实现进行了介绍。在系统的设计和实现中,主要采用了写前端界面和中间数据传输的相关技术,并利用Boostrap框架进行前端页面的编写和Django框架对前后端数据传输的编写。通过该系统,可以快速有效地进行中文文本分类
谢佩君迟呈英战学刚
关键词:系统设计
中文文本分类系统及方法
本发明公开了一种中文文本分类系统,包括广义语义深度学习模块、领域语义深度学习模块和领域本概念分模块,广义语义深度学习模块基于海量广义领域无关本集采用CBOW模型学习词汇的广义语义;领域语义深度学习模块基于各领域相关...
俞旸凌志辉
文献传递
基于改进TF-IDF特征的中文文本分类系统被引量:12
2020年
随着Internet技术的发展,人们不仅可以从网络获取信息,也能够在网络上表达个人观点、分享自身体验。自Web2.0以来网络已经由原来的阅读式网络转换成为了当今的交互式网络。而伴随网络发展的是成几何速率增长的网络信息。本信息是网络信息的重要组成部分,不同本信息可以分成新闻、娱乐、时评、财经等不同别。进行中文文本分类不仅能为建立本语料库提供便利还能够应用到其它数据挖掘领域。论基于改进TF-IDF特征并结合SVM模型设计了一种自动化的中文文本分类系统。实验证明,对比传统特征提取方式,采用改进TF-IDF特征策略进行文本分类能够获得更高的准确度。
但唐朋许天成张姝涵
关键词:文本分类自然语言处理
中文文本分类系统及方法
本发明公开了一种中文文本分类系统,包括广义语义深度学习模块、领域语义深度学习模块和领域本概念分模块,广义语义深度学习模块基于海量广义领域无关本集采用CBOW模型学习词汇的广义语义;领域语义深度学习模块基于各领域相关...
俞旸凌志辉
一种基于新闻数据的中文文本分类系统
本发明公开了一种基于新闻数据的中文文本分类系统,主要实现可靠的文本分类功能,并且可以由用户根据需求选择不同的特征选择和分算法,具有对用户提交的内容进行分、提取关键内容并展示、用户可以对结果进行修改等功能。该发明包括...
方勇黄诚刘亮丁晓旭邱瑶瑶
文献传递
基于AdaBoost-Bayes算法的中文文本分类系统被引量:7
2016年
针对中文文本分类准确率低,分算法低效不稳定问题,提出基于自适应提升朴素贝叶斯算法.该算法采用Naive Bayes和AdaBoost,并且通过优化组合结构,融合两种算法的优点.首先,使用SMEL序列组合成词算法对中文语料进行分词,提取本特征词汇.然后,使用增强的贝叶斯分器,通过较小的样本训练,提取出本特征,生成训练分矩阵.结合自适应提升算法对简单分器进行加权,保证分有平稳准确的效果.通过实验证明,该算法与其他算法相比,错误率更低,可以使分准确率达到98%以上,而且F1值也优于其他分算法.
徐凯陈平华刘双印
关键词:中文分词文本分类ADABOOSTBAYES
基于SVM的中文文本分类系统的设计与实现被引量:6
2016年
互联网已经成为现代生活中不可或缺的一部分,网络上的信息量也在以数倍的速度快速增长。无论是企事业单位,学校,或者科研院校等等机构中,都积累了非常多的资料,这些资料绝大多数都以档的形式存在。所以,如何将数以万计且排序混乱的本信息,按照一定的规则和形式进行统一的管理,以达到方便使用和管理的目的成为了一个不得不去解决的问题。本就是在SVM,即支持向量机方法的基础上,设计了一个中文文本分类系统。介绍了系统的需求分析,并对系统进行了详细设计,从概念的初始化设计到之后的详细设计,实现了基于SVM的中文文本分类系统的最终目的,达到了设计要求。
张昭楠
关键词:文本分类支持向量机文本表示
一种基于朴素贝叶斯算法的中文文本分类系统
2015年
针对中文文本分类的特点,采用中科院汉语词法分析系统ICTCLAS对档进行分词,并进行数据清洗和过滤停用词,运用信息增益和档频率特征选择算法对档进行特征选取。
崔伟
关键词:中文分词信息增益朴素贝叶斯算法
基于SVM的WEB中文文本分类系统研究与实现
近几年来,我国的互联网处于飞速发展之中,计算机的使用也不断普及,互联网上出现了海量的信息资源。如何管理、获取这些资源成为了一个极具挑战性的问题。就国内的现状而言,互联网上的信息多数是以中文Web本的形式存储、展示的。针...
刘佳
关键词:中文文本分类支持向量机WEB文本
文献传递

相关作者

杜鲁燕
作品数:5被引量:3H指数:1
供职机构:北京交通大学计算机与信息技术学院信息科学研究所
研究主题:文本分类 自然语言处理 关键词识别 向量空间模型 中文文本分类系统
苗振江
作品数:89被引量:70H指数:6
供职机构:北京交通大学计算机与信息技术学院信息科学研究所
研究主题:神经网络 图像 视频监控 关键词识别 模式识别
张鹏招
作品数:3被引量:55H指数:2
供职机构:重庆大学
研究主题:文本分类 中文文本 分散度 集中度 特征提取
杨洁
作品数:28被引量:8H指数:2
供职机构:南开大学
研究主题:多金属氧酸盐 杂化化合物 光纤隔离器 共价键 化学制备
马忠宝
作品数:9被引量:36H指数:3
供职机构:湖北工业大学计算机学院
研究主题:文本分类 基于支持向量机 支持向量机 LUCENE PAGERANK