s11竞猜平台

软件工程(cheng)硕(shuo)士论(lun)(lun)(lun)文栏目提供最(zui)新(xin)软件工程(cheng)硕(shuo)士论(lun)(lun)(lun)文格式、软件工程(cheng)硕(shuo)士硕(shuo)士论(lun)(lun)(lun)文范文。详(xiang)情咨询(xun)QQ:357500023(论(lun)(lun)(lun)文辅(fu)导)

基于生成式对抗网络与异质集成学习的文本情感分类研究

日(ri)期:2021年05月26日(ri) 编辑(ji):ad201107111759308692 作(zuo)者:s11竞猜平台 点击(ji)次数:290
论文价(jia)格(ge):150元(yuan)/篇 论文编号:lw202105121513433308 论文(wen)字数(shu):38244 所属(shu)栏目:软件工程硕(shuo)士论(lun)文
论文地区(qu):中国 论文语种:中文 论(lun)文用途:硕士毕业论(lun)文 Master Thesis

本文是(shi)一篇软件(jian)工(gong)程硕(shuo)士论(lun)文,本文通(tong)过相关(guan)研究现(xian)状(zhuang)发(fa)现(xian)传统的(de)(de)文本情感分(fen)类方法(fa)过分(fen)依赖情感词典(dian)的(de)(de)构建(jian)和繁(fan)重的(de)(de)特征清洗工(gong)程,消(xiao)耗了大量的(de)(de)人(ren)力并且可维护(hu)性很(hen)低,而基于统计(ji)机器学习(xi)的(de)(de)方法(fa)对其特征学习(xi)能力较差,无法(fa)准确地(di)识别出一些(xie)文本中隐含的(de)(de)情感特征信息。如(ru)何准确、有效地(di)挖(wa)掘出文本的(de)(de)内部情感以及提升目前(qian)现(xian)状(zhuang)阶段情感分(fen)类的(de)(de)性能是(shi)可以让(rang)计(ji)算机更加理解人(ren)类的(de)(de)情感和推动 NLP 领域(yu)向前(qian)进一步发(fa)展的(de)(de)重要一环(huan)。


第一章 绪论(lun)


1.1研究背(bei)景与(yu)意义

随(sui)着 2001 年(nian)互(hu)联网泡沫(mo)的(de)(de)(de)破灭,一个全新(xin)的(de)(de)(de)、面向未来(lai)的(de)(de)(de)新(xin)时(shi)代来(lai)临(lin)了(le)。互(hu)联网开放(fang)、共享等(deng)特性使(shi)得(de)我们(men)不(bu)再(zai)只(zhi)是互(hu)联网上(shang)的(de)(de)(de)一名(ming)冲浪者,同时(shi)也成(cheng)为了(le)波浪的(de)(de)(de)制造者。当移动互(hu)联网、智能设备普(pu)及率(lv)呈现(xian)爆发式增长的(de)(de)(de)同时(shi),人(ren)们(men)的(de)(de)(de)生活(huo)方式随(sui)之发生了(le)天(tian)翻地(di)覆的(de)(de)(de)变化。电商平台(tai)(tai)创造了(le)一种全新(xin)的(de)(de)(de)购物(wu)模式,线(xian)上(shang)教(jiao)育平台(tai)(tai)弥补了(le)乡(xiang)村教(jiao)育的(de)(de)(de)巨大短板,网络直(zhi)播平台(tai)(tai)为人(ren)们(men)提供展(zhan)现(xian)自(zi)我的(de)(de)(de)舞台(tai)(tai),政(zheng)务服务平台(tai)(tai)带来(lai)了(le)高效(xiao)便捷的(de)(de)(de)办事体验(yan)。

根据中(zhong)国互联(lian)网(wang)(wang)络(luo)信息中(zhong)心(China InternetNetworkInformationCenter,CNNIC)2019 年第 44 次《中(zhong)国互联(lian)网(wang)(wang)络(luo)发展状(zhuang)况(kuang)统计报(bao)告》显示,截至 2019 年 6 月,我(wo)国整体网(wang)(wang)民人数达(da)8.54 亿(yi),普及(ji)率达(da)到(dao) 61.2%,而我(wo)国手机(ji)(ji)网(wang)(wang)民的(de)规模高(gao)达(da) 8.47 亿(yi),通过(guo)手机(ji)(ji)上(shang)网(wang)(wang)占(zhan)比 99.1%。无线网(wang)(wang)络(luo)以及(ji)移(yi)动互联(lian)网(wang)(wang)的(de)迅速(su)发展,移(yi)动端设备已经成为人们进行网(wang)(wang)上(shang)冲(chong)浪的(de)主流方(fang)式,共同(tong)推动着各(ge)行各(ge)业走向了多元化(hua)的(de)道路。

电商平台(tai)、社交(jiao)平台(tai)、新(xin)(xin)(xin)媒体新(xin)(xin)(xin)闻(wen)平台(tai)等(deng)专业化生(sheng)产和运(yun)营的应用服务拥有着绝对(dui)数(shu)量(liang)的用户群体。我国的网络(luo)购物用户数(shu)量(liang)将近 6.4 亿(yi),而下沉市场(chang)、跨境(jing)电商、模式创新(xin)(xin)(xin)又为网络(luo)市场(chang)新(xin)(xin)(xin)添(tian)了增长(zhang)的动能。当用户面(mian)对(dui)大量(liang)良莠不(bu)齐(qi)的内(nei)容和产品时(shi),网络(luo)环(huan)境(jing)中的评(ping)论、看法、观点则起到了相当重要的引(yin)导(dao)作(zuo)用。

这些海量的价值(zhi)数据常见(jian)于以下(xia)模块:

1、热门新(xin)闻事件下的(de)舆论

大多数(shu)热门(men)新闻(wen)事件具(ju)有(you)强烈的话题(ti)性,能吸(xi)引(yin)(yin)群众甚至是政(zheng)府机(ji)关单(dan)(dan)位的高度关注。这类(lei)数(shu)据通过情感分类(lei)可以迅(xun)速地分析其情感的倾向(xiang)性以及(ji)社(she)会热门(men)事件的舆(yu)情事态,相关单(dan)(dan)位可及(ji)时引(yin)(yin)导或纠正舆(yu)论导向(xiang),提(ti)供社(she)会舆(yu)论监督(du)工作(zuo)的有(you)力保障。

2、商品评论

商(shang)品评(ping)(ping)论(lun)(lun)主要(yao)(yao)分为实(shi)(shi)体(ti)商(shang)品评(ping)(ping)论(lun)(lun)与虚拟消费(fei)级商(shang)品评(ping)(ping)论(lun)(lun)。实(shi)(shi)体(ti)商(shang)品评(ping)(ping)论(lun)(lun)主要(yao)(yao)集(ji)中(zhong)于国内拥有着海量客户(hu)(hu)群体(ti)的(de)(de)电商(shang)产品,天猫、京(jing)东、苏宁的(de)(de)众多(duo)热销(xiao)商(shang)品拥有数(shu)以万计的(de)(de)网(wang)购用(yong)户(hu)(hu)评(ping)(ping)论(lun)(lun),大部分用(yong)户(hu)(hu)无法(fa)将数(shu)万条(tiao)评(ping)(ping)论(lun)(lun)数(shu)据阅(yue)读完整后再做出(chu)判(pan)断,利(li)用(yong)机器将这些真实(shi)(shi)评(ping)(ping)论(lun)(lun)数(shu)据进(jin)行(xing)分析、挖掘,从而(er)提供(gong)给(ji)用(yong)户(hu)(hu)具有建设性的(de)(de)参考意见来引导推(tui)荐便(bian)显得很(hen)有价值。

....................


1.2国内外研究现状

文本(ben)情感(gan)分析(xi)又称意见挖(wa)掘、倾(qing)向性分析(xi),其(qi)任务(wu)是(shi)帮(bang)助用(yong)户快速(su)获(huo)取、整理和(he)分析(xi)相(xiang)关评价(jia)信(xin)息,对带有情感(gan)色彩的(de)主观性文本(ben)进行分析(xi)、处理、归纳(na)和(he)推理。该领(ling)(ling)域(yu)的(de)发(fa)(fa)展(zhan)和(he)快速(su)起步(bu)得益于(yu)网络上的(de)社(she)交媒(mei)体。自 21 世纪初以来,情感(gan)分析(xi)已(yi)经成为 NLP 领(ling)(ling)域(yu)中最热门的(de)研究领(ling)(ling)域(yu)之一,同时(shi)也(ye)在数据(ju)挖(wa)掘、WEB 挖(wa)掘、文本(ben)挖(wa)掘和(he)信(xin)息检索方面有着广(guang)泛的(de)研究。事实上,它已(yi)经从计算机科(ke)学(xue)蔓延到(dao)管理科(ke)学(xue)和(he)社(she)会科(ke)学(xue),如市场营销,金(jin)融(rong),政治学(xue),通讯,医疗科(ke)学(xue),甚(shen)至是(shi)历(li)史(shi),因其(qi)重要的(de)商业价(jia)值引发(fa)(fa)整个社(she)会的(de)共同关注。

情感分析中包含了较(jiao)多(duo)的(de)(de)(de)任务,比如情感分类(lei)、观(guan)(guan)点抽取等等。随着互联网(wang)(wang)(wang)技术的(de)(de)(de)迅速发展(zhan)和普及,对网(wang)(wang)(wang)络(luo)(luo)内容(rong)管(guan)理、监控和垃圾信息(xi)过滤(lv)的(de)(de)(de)需求越来越大,网(wang)(wang)(wang)络(luo)(luo)信息(xi)的(de)(de)(de)主观(guan)(guan)倾向性(xing)分类(lei)受到越来越多(duo)的(de)(de)(de)关注。这种(zhong)分类(lei)与传统的(de)(de)(de)文(wen)(wen)本(ben)分类(lei)不同,传统的(de)(de)(de)文(wen)(wen)本(ben)分类(lei)所(suo)关注的(de)(de)(de)是(shi)文(wen)(wen)本(ben)的(de)(de)(de)客观(guan)(guan)内容(rong),而倾向性(xing)分类(lei)所(suo)研(yan)究(jiu)的(de)(de)(de)对象是(shi)文(wen)(wen)本(ben)的(de)(de)(de)“主观(guan)(guan)因(yin)素”,即作者所(suo)表(biao)达(da)出来的(de)(de)(de)主观(guan)(guan)倾向性(xing),分类(lei)的(de)(de)(de)结果是(shi)对于一个特(te)(te)定的(de)(de)(de)文(wen)(wen)本(ben)要得到它是(shi)否支(zhi)持某(mou)种(zhong)观(guan)(guan)点的(de)(de)(de)信息(xi)。这种(zhong)独特(te)(te)的(de)(de)(de)文(wen)(wen)本(ben)分类(lei)任务又称为情感分类(lei)。纵(zong)观(guan)(guan)目前主观(guan)(guan)性(xing)文(wen)(wen)本(ben)情感倾向性(xing)分析的(de)(de)(de)研(yan)究(jiu)工作,主要的(de)(de)(de)研(yan)究(jiu)思路分为以下三(san)类(lei):

1、基于语义情感(gan)(gan)极性词(ci)典的文本(ben)情感(gan)(gan)分(fen)(fen)类方法(fa)2、基于传统统计机器学习的文本(ben)情感(gan)(gan)分(fen)(fen)类方法(fa)3、基于更(geng)深(shen)(shen)层次深(shen)(shen)度学习的文本(ben)情感(gan)(gan)分(fen)(fen)类方法(fa)

本文将针对以上三种均具有广泛性应(ying)用的(de)(de)文本情感分类方法的(de)(de)研究现状逐一进行简单(dan)综述。

...........................


第二章(zhang) 相关(guan)背景知识介绍


2.1文本表(biao)示模型

文本(ben)(ben)是(shi)(shi)由字(zi)符、标(biao)点符号进(jin)行(xing)合(he)理(li)(li)组(zu)合(he)而生成的(de)(de)可被人类理(li)(li)解(jie)的(de)(de)一种非(fei)结(jie)构化(hua)(hua)数(shu)据。而计(ji)算机仅能(neng)处(chu)理(li)(li)二进(jin)制模(mo)(mo)式(shi)的(de)(de)数(shu)据,对于(yu)这(zhei)类特殊的(de)(de)抽象(xiang)字(zi)符无法直(zhi)接进(jin)行(xing)处(chu)理(li)(li),所以(yi)首(shou)要(yao)的(de)(de)工作便是(shi)(shi)如何(he)将这(zhei)类抽象(xiang)字(zi)符转换成可被计(ji)算机处(chu)理(li)(li)的(de)(de)数(shu)值模(mo)(mo)式(shi)结(jie)构化(hua)(hua)数(shu)据。文本(ben)(ben)的(de)(de)向(xiang)量化(hua)(hua)则(ze)是(shi)(shi)后续研究工作得以(yi)解(jie)决该问题(ti)的(de)(de)关键(jian)思(si)想(xiang)。目前(qian)文本(ben)(ben)主流的(de)(de)向(xiang)量化(hua)(hua)表示方法分(fen)为基(ji)(ji)于(yu)空间(jian)向(xiang)量表示[79]的(de)(de)词(ci)袋模(mo)(mo)型以(yi)及基(ji)(ji)于(yu)分(fen)布(bu)式(shi)表示的(de)(de)词(ci)嵌入(ru)模(mo)(mo)型。

2.1.1 词袋(dai)模型

最(zui)初的(de) One-Hot 编(bian)码(ma)是(shi)如(ru)今词(ci)袋模型(xing)的(de)前身,将每一个(ge)词(ci)表(biao)示为(wei)一维向(xiang)量(liang)(liang)(liang),其(qi)中向(xiang)量(liang)(liang)(liang)的(de)维度是(shi)文本所有词(ci)构(gou)成词(ci)集的(de)数(shu)量(liang)(liang)(liang),每个(ge)词(ci)都独(du)立地将某一个(ge)向(xiang)量(liang)(liang)(liang)位置(zhi)(zhi)置(zhi)(zhi)为(wei) 1 其(qi)余位置(zhi)(zhi)置(zhi)(zhi)为(wei)0,该(gai)方法直(zhi)接通俗易懂且(qie)简(jian)单易于(yu)实现(xian)。

词(ci)(ci)(ci)袋(dai)模型(xing)是对(dui) One-Hot 编码(ma)的(de)进一步(bu)优化(hua),是一种先将(jiang)文(wen)(wen)本中出现的(de)词(ci)(ci)(ci)进行频(pin)率(lv)统(tong)计,再使文(wen)(wen)本词(ci)(ci)(ci)集(ji)数量(liang)表(biao)示维(wei)度的(de)文(wen)(wen)本向量(liang)对(dui)应词(ci)(ci)(ci)位(wei)(wei)置通(tong)过(guo)词(ci)(ci)(ci)频(pin)数值来表(biao)示的(de)方(fang)法(fa)(fa)(fa)。当然这(zhei)种仅仅通(tong)过(guo)统(tong)计词(ci)(ci)(ci)频(pin)的(de)方(fang)式确实(shi)一定程度上(shang)解决了 One-Hot 编码(ma)严(yan)重稀疏(shu)的(de)问题,但仍然没(mei)有包含文(wen)(wen)本中任何的(de)语法(fa)(fa)(fa)、语义(yi)信息,也直接丢(diu)失了词(ci)(ci)(ci)之间(jian)(jian)的(de)顺序信息。而随(sui)着神经网络逐渐登上(shang)舞台,基于(yu)分布式表(biao)示的(de)词(ci)(ci)(ci)向量(liang)模型(xing)瞬间(jian)(jian)成功占据了文(wen)(wen)本表(biao)示方(fang)法(fa)(fa)(fa)的(de)主导地位(wei)(wei)。

图 2.1Word2Vec 两种结构

..........................


2.2文本机器学(xue)习(xi)模型

文(wen)本(ben)(ben)情(qing)感(gan)分(fen)(fen)类(lei)(lei)(lei)就(jiu)是(shi)将(jiang)文(wen)本(ben)(ben)蕴(yun)含(han)的情(qing)感(gan)倾向归(gui)类(lei)(lei)(lei)到所预设的类(lei)(lei)(lei)别中,目前(qian)主(zhu)要分(fen)(fen)为监(jian)督(du)(du)(du)(du)学(xue)(xue)习(xi)文(wen)本(ben)(ben)情(qing)感(gan)分(fen)(fen)类(lei)(lei)(lei)、半监(jian)督(du)(du)(du)(du)学(xue)(xue)习(xi)文(wen)本(ben)(ben)情(qing)感(gan)分(fen)(fen)类(lei)(lei)(lei)以及(ji)无监(jian)督(du)(du)(du)(du)学(xue)(xue)习(xi)文(wen)本(ben)(ben)情(qing)感(gan)分(fen)(fen)类(lei)(lei)(lei)。本(ben)(ben)文(wen)所涉(she)及(ji)的文(wen)本(ben)(ben)情(qing)感(gan)分(fen)(fen)类(lei)(lei)(lei)主(zhu)要是(shi)监(jian)督(du)(du)(du)(du)式学(xue)(xue)习(xi)的方式,其中针(zhen)对朴素贝叶(ye)斯、支持向量机和决策树(shu)模(mo)型展开(kai)简要介绍和分(fen)(fen)析。

2.2.1决策树模(mo)型

决策树是一种基于(yu)实(shi)例的(de)(de)(de)归(gui)纳(na)学习并且将(jiang)输入空间(jian)分(fen)(fen)成不同的(de)(de)(de)区域,每(mei)个(ge)区域有(you)独(du)立参数(shu)的(de)(de)(de)算(suan)法模(mo)型(xing)。该模(mo)型(xing)利(li)用(yong)(yong)树形结(jie)(jie)构进(jin)行分(fen)(fen)类(lei)决策,树中每(mei)个(ge)非叶子(zi)结(jie)(jie)点(dian)(dian)记录(lu)了(le)使(shi)用(yong)(yong)某个(ge)特(te)征来(lai)进(jin)行类(lei)别的(de)(de)(de)判断(duan)即(ji) if-else 规则(ze)(ze),而每(mei)个(ge)叶子(zi)结(jie)(jie)点(dian)(dian)则(ze)(ze)代表(biao)了(le)最后判断(duan)的(de)(de)(de)类(lei)别,其中针对特(te)征选(xuan)择(ze)划分(fen)(fen)结(jie)(jie)点(dian)(dian)的(de)(de)(de)原则(ze)(ze)便是使(shi)得(de)当前(qian)结(jie)(jie)点(dian)(dian)的(de)(de)(de)分(fen)(fen)支节(jie)点(dian)(dian)类(lei)别纯度(du)尽可(ke)能最大化。DT 模(mo)型(xing)与(yu)其他分(fen)(fen)类(lei)算(suan)法模(mo)型(xing)相较而言比较简单易懂,训练数(shu)据集只需要满足能够使(shi)用(yong)(yong)特(te)征向量和类(lei)别进(jin)行表(biao)示的(de)(de)(de)条件(jian)即(ji)可(ke)直(zhi)接(jie)构造 DT 模(mo)型(xing),算(suan)法复杂度(du)仅与(yu)树型(xing)结(jie)(jie)构的(de)(de)(de)层(ceng)数(shu)有(you)关,因(yin)此预测处理效率(lv)很高。

由于可以根(gen)据不同的准则来进(jin)行特征划分结点,于是衍生出(chu)了几类(lei)常见的DT分类(lei)模型,具体(ti)区别(bie)对比如表 2.1 所示。

表 2.1 常见决策树分类模型

..................................


第三章 基于DBGRU-MFCNN 的文本情感分类研究(jiu).............................25

3.1 深度双向门(men)控循环单元..............................25

3.2 多特征(zheng)卷积神经(jing)网络...............................27

第四章 基于VAE-ECGAN的(de)文本情(qing)感分(fen)类研究.................................... 46

4.1 基(ji)于VAE-ECGAN 的(de)文(wen)本情感分(fen)类...................... 46

4.1.1 编码器.................................. 47

4.1.2 解(jie)码(ma)生成器................................. 47

第(di)五章 总结与展望................... 61

5.1 工作总结..............................61

5.2 未(wei)来展望.................................62


第四(si)章 基于 VAE-ECGAN 的(de)文本情感分类研究


4.1基于 VAE-ECGAN 的文本情感分类

本章(zhang)将介绍(shao)基于 VAE-GAN,并结合了 BiLSTM、DBGRU、注意(yi)力(li)机制、集成(cheng)学习以及策(ce)略梯度优化来进行(xing)情感文本的生成(cheng),具体网络如图 4.1 所示。

模(mo)型(xing)在(zai)(zai)整体结(jie)构上(shang)采用(yong)了 VAE 和(he)(he)(he) ACGAN 相结(jie)合的(de)(de)(de)(de)方式,但在(zai)(zai)辅助分类(lei)器(qi)部(bu)分本(ben)(ben)(ben)(ben)文使用(yong)了集(ji)成(cheng)学(xue)(xue)习(xi)的(de)(de)(de)(de)模(mo)式对(dui)其(qi)(qi)进(jin)(jin)行(xing)了改进(jin)(jin)。由(you)于真(zhen)实的(de)(de)(de)(de)文本(ben)(ben)(ben)(ben)情(qing)(qing)(qing)(qing)感(gan)特(te)(te)征(zheng)信(xin)息(xi)不会(hui)特(te)(te)别(bie)明(ming)显(xian)(xian),当(dang)特(te)(te)征(zheng)信(xin)息(xi)与标(biao)签存(cun)在(zai)(zai)较弱的(de)(de)(de)(de)对(dui)应关系时(shi),模(mo)型(xing)对(dui)其(qi)(qi)建(jian)模(mo)和(he)(he)(he)特(te)(te)征(zheng)挖(wa)掘会(hui)存(cun)在(zai)(zai)一(yi)定(ding)(ding)的(de)(de)(de)(de)难度,导致(zhi)情(qing)(qing)(qing)(qing)感(gan)分类(lei)效果出现(xian)瓶颈现(xian)象。而(er) VAE-ACGAN 因(yin)其(qi)(qi)是由(you)模(mo)型(xing)自身在(zai)(zai)充分学(xue)(xue)习(xi)带有情(qing)(qing)(qing)(qing)感(gan)信(xin)息(xi)的(de)(de)(de)(de)文本(ben)(ben)(ben)(ben)特(te)(te)征(zheng)后,通(tong)过(guo)指定(ding)(ding)情(qing)(qing)(qing)(qing)感(gan)类(lei)别(bie)的(de)(de)(de)(de)方式进(jin)(jin)行(xing)文本(ben)(ben)(ben)(ben)生成(cheng),模(mo)型(xing)会(hui)为了满足其(qi)(qi)需(xu)要(yao)携(xie)带的(de)(de)(de)(de)情(qing)(qing)(qing)(qing)感(gan)特(te)(te)征(zheng),在(zai)(zai)文本(ben)(ben)(ben)(ben)生成(cheng)过(guo)程中(zhong)有主观选择(ze)性地将(jiang)情(qing)(qing)(qing)(qing)感(gan)信(xin)息(xi)特(te)(te)征(zheng)较为明(ming)显(xian)(xian)的(de)(de)(de)(de)词优(you)先加(jia)入至(zhi)文本(ben)(ben)(ben)(ben)中(zhong)。因(yin)此(ci)将(jiang)输(shu)入至(zhi) D 中(zhong)的(de)(de)(de)(de)生成(cheng)文本(ben)(ben)(ben)(ben)和(he)(he)(he)真(zhen)实文本(ben)(ben)(ben)(ben)同时(shi)输(shu)入至(zhi)集(ji)成(cheng)学(xue)(xue)习(xi)的(de)(de)(de)(de)基(ji)分类(lei)器(qi)进(jin)(jin)行(xing)训练(lian)(lian)(lian)(lian)学(xue)(xue)习(xi),当(dang)训练(lian)(lian)(lian)(lian)数(shu)据(ju)集(ji)中(zhong)同时(shi)包含了人工标(biao)注(zhu)情(qing)(qing)(qing)(qing)感(gan)数(shu)据(ju)集(ji)和(he)(he)(he)机(ji)器(qi)标(biao)注(zhu)情(qing)(qing)(qing)(qing)感(gan)数(shu)据(ju)集(ji)时(shi),再结(jie)合 Stacking 算法对(dui)混合训练(lian)(lian)(lian)(lian)数(shu)据(ju)集(ji)进(jin)(jin)行(xing)建(jian)模(mo)学(xue)(xue)习(xi),可以使情(qing)(qing)(qing)(qing)感(gan)分类(lei)效果进(jin)(jin)一(yi)步提升(sheng)的(de)(de)(de)(de)同时(shi),又能够让(rang) G 生成(cheng)情(qing)(qing)(qing)(qing)感(gan)类(lei)别(bie)更(geng)加(jia)准确的(de)(de)(de)(de)文本(ben)(ben)(ben)(ben)。首(shou)先将(jiang)原始数(shu)据(ju)同第(di)三章进(jin)(jin)行(xing)预处理工作(zuo),将(jiang)处理好的(de)(de)(de)(de)训练(lian)(lian)(lian)(lian)数(shu)据(ju)使用(yong)BERT 和(he)(he)(he) Word2Vec 两种预训练(lian)(lian)(lian)(lian)模(mo)型(xing)进(jin)(jin)行(xing)文本(ben)(ben)(ben)(ben)特(te)(te)征(zheng)向(xiang)量(liang)表示,然后将(jiang)文本(ben)(ben)(ben)(ben)输(shu)入至(zhi) VAE 模(mo)块进(jin)(jin)行(xing)训练(lian)(lian)(lian)(lian),其(qi)(qi)中(zhong) VAE 编码器(qi)和(he)(he)(he)解码器(qi)均采用(yong) BiLSTM 进(jin)(jin)行(xing)潜在(zai)(zai)向(xiang)量(liang)提取和(he)(he)(he)序列输(shu)出,并(bing)结(jie)合了注(zhu)意力机(ji)制。随后将(jiang)两种生成(cheng)的(de)(de)(de)(de)文本(ben)(ben)(ben)(ben)特(te)(te)征(zheng)向(xiang)量(liang)输(shu)入到基(ji)于Stacking 算法并(bing)且包含了 NB模(mo)型(xing)、DT 模(mo)型(xing)、SVM 模(mo)型(xing)以及(ji) DBGRU-MFCNN 的(de)(de)(de)(de)集(ji)成(cheng)模(mo)型(xing)中(zhong)进(jin)(jin)行(xing)判(pan)别(bie),其(qi)(qi)中(zhong) DBGRU-MFCNN 还需(xu)要(yao)对(dui)文本(ben)(ben)(ben)(ben)的(de)(de)(de)(de)真(zhen)伪(wei)性进(jin)(jin)行(xing)判(pan)定(ding)(ding),通(tong)过(guo)策略(lve)

该论文为收费论文,请加QQ1135811234联系客服人员购买全文
S11比赛竞猜-S11赛事竞猜-S11全球总决赛竞猜官网-腾讯游戏 LOL竞猜-S11赛事竞猜-LOL竞猜官网 S11竞猜-S11赛事竞猜官网