您的当前位置:首页正文

基于神经网络的中小学生情感分析

2021-09-20 来源:好走旅游网
基于神经网络的中小学生情感分析陈宇航

(西安铁一中滨河学校,陕西西安,710000)

科技论坛

摘要:随着时代的发展,社会越来越看重年轻人的学习与抗压能力,所以外界对中小学生抱有很大的期望,这将直接或间接导致当代中小学生的压力过大,再加上中小学生正好处于青春期这一心理敏感的时期,老师家长的忽视,导致了中小学生的自杀率的提高。如果我们在关注学生的心理方面增加注意的话,将会挽救许多年轻鲜活的生命。本文运用基于神经网络的自然语言处理技术,识别中小学生的心理状况,使家长老师提前进行心理疏导,教师还可以根据检测结果进行相应的辅导,从而使学生时刻保持积极向上的生活态度。关键词:神经网络;Word Embedding;文本情感分析;LSTM0 引言

也年年攀升,有一则数据显示,在中国,每年约有10万青少年死于自杀。每分钟就有2个人死于自杀,还有8个自杀未遂。

近年来,随着互联网的发展,越来越多的中小学生使用

随着时代的发展,中小学生的压力越来越大,自杀人数

(1)词之间存在相似关系: (2)包含更多信息:

比较近。这对很多自然语言处理的任务非常有帮助。一维都有特定的含义。■ 1.2 神经网络

词之间存在“距离”概念,即意思相近的词之间距离会Word Embedding能够包含更多信息,并且向量的每神经网络是一种模仿人脑的机器学习算法,这种网络依

QQ,微信等聊天软件,其中,微信朋友圈更是受到广泛欢迎。这些聊天软件里蕴含了大量的文本信息,并且这些文本直接或间接表明了中小学生的情感倾向和状态,如果对这些信息用,将会极大降低中小学生的自杀率。本系统以神经网络为合理运用语料库,识别中小学生的心理状况,从而达到心理辅导的目的。

加以合理运用,则会对调查青少年的心理状况起到很大的作基础,将长短期记忆网络(LSTM)与词向量相结合,充分

靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的,并具有自学习和自适应的

1.2.1 前馈神经网络

能力。

中,各神经元从输入层开始,接收前一级输入,并输入到下一级,直至输出层。前馈神经网络有输入层,隐藏层和输出层,隐藏层的节点个数不限。

我们一般用代价函数来衡量模型的好坏,训练时可用梯

前馈神经网络是最简单的神经网络,在此种神经网络

1 理论

■ 1.1 词向量

化,词向量就是用来将语言中的词进行数字化的一种方式。

1.1.1 One-hot

当我们用计算机处理自然语言时,通常需要将语言数字

度下降法来找到使代价函数最小化的模型参数。在梯度下降来进行神经网络的学习。

反向传播算法分为两步进行:

法的基础上,我们使用反向传播算法(Backpropagation)

(1)正向传播:输入的样本从输入层经过隐藏层一层(2)反向传播:将预测的结果与真实结果比较得到误

为词典大小的不同向量来表示词。向量中只有在该词出现的位置的元素才为1,其它元素全为0。

表示方法向量过长,会导致维度灾难。其次,One-hot编系,哪怕是手机和电话这样的同义词也不能幸免于难。

但是这种方法有两个问题:首先,对于实际应用,这种

One-hot[1]就是将所有需要的词固定好顺序,并用长度

一层进行处理,通过所有的隐层之后,传向输出层,得到一个预测的结果。

差,把误差信号按原路径反向传回,同时对路径上各个神经元的系数进行修改,使得误差信号趋向最小。

1.2.2 循环神经网络

码表示无法刻画不同词语之间的语义关联,即任意两个词之

间都是孤立的。光从这两个向量中看不出两个词是否有关

1.1.2 Word Embedding

用一个低维度的、包含更多语义信息的向量来表示一个词,Word2Vec算法完成向量的训练。

Word Embedding[2]可以克服One-hot的缺点,其利

也是前馈神经网络的一种,由输入层,输出层和隐藏层构成。网络,是循环神经网络的一个变种。不同于一般的循环神经

LSTM(Long Short Term Memory)[4],即长短期记忆

循环神经网络(RNN)[3]经常被用来处理序列数据,其

这样的向量是通过训练得到的。我们可以利用Google的

与One-hot相比,Word Embedding拥有以下两个优点:

网络,LSTM多了一个细胞状态(Cell),用来储存有用信息,是由当前状态新输入信息和上一个细胞状态的信息相加

www�ele169�com󰀁󰀁|󰀁󰀁87

科技论坛而成,这种加法也避免了一般循环神经网络的梯度爆炸/消失问题。传回,沿途修改神经网络参数。经过多次前向传播算法和反训练完模型之后就可以使用模型了。将某学生的日向传播算法的训练,得到最终的模型,并将模型参数保存好。志和朋友圈信息输入到训练好的模型中,经过输入层、示该生情感倾向的一个值,即可分析该生的心理状况。Embedding层、隐藏层和输出层的处理,最终得到一个表3 实验图1 LSTM结构图■ 3.1 实验设置出门。LSTM模型大体有三部分构成。即输入门,遗忘门和输(1)遗忘门(forget gate):它决定了上一时刻的细(2)输入门(input gate):它决定了当前时刻网络(3)输出门(output gate):它用来控制当前细胞状

正负样本各25000条。将数据集进行划分:训练集40000条,开发集5000条,测试集5000条。表1 LSTM参数参数Batch󰀁sizeUnit-numLSTM层Epoch本文实验数据来自IMDB公开数据集,共50000条数据,实验参数如表1所示。

值641283210胞状态有多少信息要保留到当前时刻的细胞状态。的新输入信息有多少要保存到细胞状态。态有多少信息需要输出。

2 模型

■ 3.2 实验结果参数学习率损失函数激活函数词向量维度值0�01交叉熵损失LeakyReLU

300日志和朋友圈信息输入到模型的输入层,需要注意的是我们在这里要将字词转换为One-hot向量作为输入。输入层有多少个字词,One-hot向量就有多少个,呈一一对应的关系。之后,One-hot向量经过Word2Vec[5]预训练好的

首先,我们需要训练模型。将收集到并处理好的学生

92.21%的准确率。可见,该模型用于文本分类如情感分析可得到很不错的效果。

本文使用LSTM对IMDB数据进行训练和测试,得到

4 总结与展望

Embedding层,被转换成Word Embedding。接着,将

上述技术结合起来,制作成软件APP,投入到教师或者心理咨询师当中使用,合理运用,将充分保障青少年们的心理的问题,例如用户朋友圈等资料较难获取,例如教师家长在使用的时候容易对学生的隐私造成侵扰损害,侵害青少年们的隐私权,这势必会造成青少年们的抵抗反感,甚至会起到

负面影响,事与愿违。但是我们相信,将这些问题克服以后,本项目将会大的贡献。

参考文献本项目充分利用神经网络和词向量等技术,我们可以将

Word Embedding输入到LSTM中,最后经过全连接层和将预测的结果和真实结果相比较,得到误差,再将误差反向

Logistic回归得到情感分析结果,即一个0到1之间的概率

健康安全。但是,这项技术仍然存在许多法律制度和伦理上

值,该值越接近0表示越消极,反之,越接近1表示越积极。

对青少年的心理健康状况监测有巨

* [1] 张金瑞. 基于LDA的文本分类2017.

研究及其应用[D]. 郑州大学: 郑州大学, * [2] Mikolov T, Sutskever I, Chen K, et al. Distributed representations of wor

图2 中小学生情感分析模型ds and phrases and. their compositionality [C]//Advances in Neural Informati

(下转第75页)

88󰀁󰀁|󰀁󰀁电子制作󰀁󰀁󰀁󰀁2019年12月

应用技术

以看见一幅稳定的画面了。件和软件的配合程度,摒弃了其他设备中的不足,选用具有也是教学变得更简单,提高了学生学习效率。移位寄存功能和缓存并行输出功能的74595作为列驱动芯

片,使得数据输出只需要一个端口,优化了电路,降低成本,

图6 程序工作流程图图7 调试实物图参考文献■ 3.3 实物调试图

流电压供电,通电运行。

连接最小系统板和本设计电路板,烧录程序后,+5V直

* [1]陈堂敏.刘焕平主编.单片机原理与应用[M].北京:北京理工* [2]沈美明.温动蝉编著.IBM-PC汇编语言程序设计[M].北京:* [3]张仰森等编.微型计算机常用软硬件技术速查手册[M].北京:* [4]江修汗等编.计算机控制原理与应用[M].西安:西安电子科技大学出版社, 1999.北京希望电脑公司, 1994.清华大学出版社, 1994.大学出版社, 2007.

4 总结

了解学习了市面上各种教育实训设备中关于点阵显示的电路后,发现大部分电路要么占用过多的I/O口,要么使用过

本显示系统不算是高科技或者是前沿的设计,但在充分

多的外围辅助芯片,加大了编程难度,本设计充分优化了硬

(上接第30页)

* [2]胡明晖. 基于单片机和遗传算法的交叉口实时控制研究[D]. * [3]彭力, 王巍. 利用改进型遗传算法实现两路口交通灯控制[J]. * [4]蔡俊宁. 遗传算法在交通控制中的应用[J]. 科技致富向导, * [5]杨琰. 重庆市渝中区智能交通系统设计研究[D]. 重庆交通大* [6]武广号, 文毅, 乐美峰. 遗传算法及其应用[J]. 应用力学学报, (上接第88页)

学, 2014.2015(9):38-39.

计算机应用, 2007(04):228-230.长安大学, 2012.学,2017.

* [7]秦建平, 唐国才, 倪娜,等. 城市A类平面交叉口控制新模型* [8]张丽霞, 唐泽. 基于FPGA的遗传算法在交通控制中的应用[J]. * [9]唐惠, 王磊, 邵晓根, et al. 智能交通灯控制系统的研究与设* [10] 唐泽. 基于FPGA的遗传算法在交通控制中的应用[D]. 西南交通大学, 2015.

计[J]. 科技与创新, 2017(7):20-22.现代电子技术, 2015(15):161-165.[J]. 市政技术, 2014, 32(4).

2000, 23(6):9-10.

* [3] EBRAHIMI J,DOU D. Chain based RNN for relation classifi-cation [EB/OL].[2014-09-03]. http:/ /www. aclweb. org/anthol-ogy/N/ N15 /N15-1133. pdf.

on Processing Systems. 2013: 3111- 3119.

* [5] Mikolov T, Corrado G, Chen K, et al. Efficient estimation of word representations in vector. space [C]//International Conference on Learning Representations. 2013: 1-12.

Neural Computation, 1997, 9(8): 1735-1780.

* [4] Hochreiter S, Schemidhuber J. Long short-term memory [J].

www�ele169�com󰀁󰀁|󰀁󰀁75

因篇幅问题不能全部显示,请点此查看更多更全内容