基于差分优化语义相似度模型的智能组卷系统

汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

基于差分优化语义相似度模型的智能组卷系统

3月23日孤小单投稿

　　摘要：文章针对组卷系统中容易对同一语义内容但不同形式的题目多次出现在同一张试卷中的问题，提出了基于差分优化语义相似度模型的组卷系统。此系统引入语义相似度模型，在组卷的过程较好地避免了重复知识点的考查，增加了组卷的成功率；在语义相似度模型的基础上，对一些参数不再用手动的方式调整，采用差分算法对模型中的相关参数进行动态的调控，不仅可以避免手动调整参数的辛苦，又在全局范围中获得最优化的参数，从而保证了自动组卷系统的科学性、公正性、高效性，该系统对题目知识结构，数据延展进行全方位的跟踪管理，多种考试形式丰富组织方式。
　　关键词自动组卷系统语义相似度模型余弦相似度差分优化
　　中图分类号：TP391。3文献标识码：ADOI：10。16400j。cnki。kjdks。2016。02。073
　　0引言
　　现阶段，有不断增加的考试类型和不断提高的考试要求，随即而来，也越来越增加了教师的工作量。为适应现代考试的需要，传统的考试方法应该慢慢地被淘汰了。目前有着迅速发展的计算机应用，网络应用不断扩大，如远程教育和虚拟大学的出现等等，且这些应用正逐步深入到千家万户。在线考试都会需要这些网络应用技术，期待减轻教师的工作负担以及提高工作效率，与此同时提高了考试的质量，从而使考试更趋于公正、客观，更加激发学生的学习兴趣。鉴于以上现状和结合当前市面上考试系统的特点与不足，一种新型的语义相似度模型的自动组卷系统应运而生。
　　1基于差分优化语义相似度模型的自动组卷系统
　　针对现有自动组卷系统的不足，本论文提出基于差分优化语义相似度模型的自动组卷系统，以提高所组试卷的质量。例如避免在组卷过程中产生选择、填空、判断三者之间对同一知识点考查多次的问题；改进传统的组卷系统，借助语义相似度模型实现对填空，问答的审阅，使得组卷变得更科学、更智能，以减轻老师负担和提高系统工作效率。基于差分优化语义相似度模型的自动组卷系统具有以下特点：
　　（1）引入语义相似度模型；（2）具有普适性，基于语义层面的相似度模型使得系统不再局限于少数几门学科；（3）提高组卷效率，借助语义相似度模型，在组卷的过程较好地避免了重复知识点的考查，增加了组卷的成功率；（4）题型更加全面，借助文本相似度的计算实现了对填空，问答等主观题的组卷；（5）组卷具有高效性，省去了人工组卷环节，系统的工作效率得到了质的飞跃；（6）采用差分算法对模型中的相关参数进行动态的调控，不仅可以避免手动调整参数的辛苦，又在全局范围中获得最优化的参数，从而保证了自动组卷系统的科学性、公正性、高效性。
　　1。1语义相似度模型的设计与实现
　　文本语义相似度量方法大多将文比文本看作一组词的集合体，分析每个词在文本中出现的次数以及在整个文本集合中出现的次数，进而利用这些词频信息将文本建模为一个向量，并利用向量间的余弦相似度、Jaccard相似度等方法计算文本之间的相似度。基于语义的文本相似度量方法则通过同义词、冗余和蕴涵等语义关系来考查文本之间的相似度。
　　鉴于已经存在的问题的一些不足，在本文中将采用一种能有效降低文本表示模型的维度，又能结合词项语义信息进行相似度量计算的方法。
　　1。2语义相似度模型具体算法
　　对于语义相似度模型的算法，主要有两个关键操作：关键词的提取、关键词项向量间的相似度计算。
　　1。2。1关键词的提取
　　（1）首先预处理文本中的人名、地名、无实意的常用字（在TFIDF方法中有相关识别技术），将它们用per，loc，org等词代替，因为这类词具有较高的TFIDF值，从而容易导致对文本关键词项的错误选择；然后，必须对文本中的词项进行词性分析，给出词项的语义属性，即该词项是名词、动词还是副词等。
　　（2）关键词项的选择：文本预处理完成后，需要对整个文本集合中的词项进行TFIDF值计算，并将词项的TFIDF值进行排序，选取TFIDF值大于P（P为百分比）的名词动词词项作为关键词项。
　　（3）由于关键词项代表了一篇文本中最重要的信息，因此文本的相似度就可以由关键词项向量间的相似度来描述。因此，文本之间的相似度就转换为关键词项向量间的相似度。
　　1。2。2关键词项向量间的相似度计算
　　借助HowNet中的思想，将词语理解为多个义原（语义的最小原子）的集合，两个义原集合相似度即词项相似度，先寻找最优匹配，集合中批次最相似的元素两两组合，然后加权值就是整体相似度。每个义原在定义概念中的作用大小不同，义原所携带的语义信息越丰富，权值越大。义原相似度的计算则使用刘群的公式：sSim（S1，S2）a（adistance（S1，S2））计算。若词项整体相似度0。5则判定为相似。然后，以类似的方法，借用权值在得出关键词项相似度的情况下，计算文本相似度。
　　1。3将语义相似度模型应用到组卷模块
　　为了避免题目内容上的重复，把语义相似度模型应用到组卷系统中，以实现组卷系统的试题在内容上的非冗余性和形式上的科学性，其步骤如下：
　　获取某一问答题考生所给答案文本及标准答案文本；
　　若试题标准答案已设置关键字，将考生所给答案文本与关键字做匹配，匹配成功率直接与最后评分关联。若未预先设置关键字，直接进行下一步；
　　将考生所给答案文本与标准答案文本做相似度计算，根据文本相似度计算结果以及提前设置的评分算法进行评分。（评分算法：举例scoreS1aS2b，Score为此题最后得分，S1为中匹配成功率S2为中文本相似度计算结果a，b为权重比）
　　1。4差分算法优化语义相似度模型的相关参数
　　由于差分算法采用对个体进行方向扰动，以达到对个体的函数值进行下降的目的，此算法不利用函数的梯度信息，因此对函数的可导性甚至连续性没有要求，适用性很强。对于词项相似度的参数、文本相似度的参数，通过差分算法自动寻优找到最优的参数，摈弃传统的手动主观控制参数方式，从而得到更科学的语义相似度模型，进而得到更智能、更客观的组卷系统，这是手动组卷方法所不能企及的。
　　2结论
　　针对组卷系统中容易对同一语义内容但不同形式的题目多次出现在同一张试卷中的问题，提出了基于差分优化语义相似度模型的组卷系统。采用一种能有效降低文本表示模型的维度，又能结合词项语义信息进行相似度量计算的方法进行自动组卷，以提高自动组卷的质量，实现自动组卷的科学性；通过差分算法自动寻优找到最优的参数，摈弃传统的手动控制参数方式，从而得到更科学的语义相似度模型，进而得到更智能、更客观的组卷系统。
　　参考文献
　　〔1〕MikolovT。Word2vecproject〔EBOL〕。（20140903）〔20150410〕。http：code。google。compword2vec。
　　〔2〕谷波，刘开瑛。中文文本分类中一种简单高效的特征词选择方法〔C〕。2005第一届中国分类技术与应用研讨会（CSCA）。2005：356360。
　　〔3〕周练。Word2vec的工作原理及应用探究〔J〕。科技情报开发与经济，2015（2）：145148。
　　〔4〕郑文超，徐鹏。利用word2vec对中文词进行聚类的研究〔J〕。软件，2013（12）：160162。

投诉评论转载

日语外来语的使用意图和效果日语外来语的使用意图和效果一、问题的提出一种语言极少可能完全独立于其他语言而存在，总会和其他语言之间或多或少存在着相互影响。当然，影响的程度由于地理条件、国交亲密度……高师声乐教学改革分析论文声乐教学改革为声乐教学实践带来了新理念、新动力和高效率，同时也在具体的教学实践中出现了一些有待研究和解决的问题，其中声乐课程学时量不能充分满足教、学实际需求的问题较为突出，但对……工程管理论文范文对于工程项目的质量管理而言，不仅要从最初开始的规划设计入手，还要对工程项目运行施工，包括设计施工变更上进行全面把握。下面是小编为大家整理的工程管理专业毕业论文，供大家参考。工程……油价与燃油税之说综合新能源论文（1）6月6日清晨，强大的热带风暴古努伴随着暴雨袭击了阿曼沿岸。狂风暴雨掀起了十余米的巨浪，横扫了伊朗南部和波斯湾产油地区。气象学家认为，这是60年来阿……浅谈现代文学作品差韵味的展现摘要：研究周作人在其文学作品《喝茶》中茶韵味的目的在于了解其创作这篇散文的时代与背景，透过文字看到其间蕴藏的茶文化内涵，体会作者试图展示的更加深刻的茶韵味。本文介绍了周作人散文……建筑工程绿色施工技术研讨1前言绿色节能施工技术在建筑工程项目中的应用，避免了环境污染、能源浪费、成本增加等不足，同时有利于延长建筑工程使用年限，提升建筑项目整体质量及各项性能，创建和谐健康的生活……中职校语文教学创新思路论文第一篇：中职校语文教学创新思路论文一、中职学校语文教学的发展现状1。贯彻以人为本的教学思想，推动中职学校语文教学改革的发展素质教育强调对学生主体地位的凸显，以……韩柳文学批评论文一、前边我们说过韩柳的目的，最先是要行其道，如果不能行其道于当时的话，这才从事著作，以传于后世。但是言之不文，行之不远，所以也得注意文辞。然文辞如何才能好呢？其方法也是学……情感艺术在广告设计中的应用论文现代社会的进步，助动着各个行业领域企业的发展，市场经济的竞争态势越来越激烈，而这也就决定了广告竞争的状态。尤其是现代工业产品的生产已经到达了瓶颈，产品的同质化生产成为了一大通病……汉语史专书词汇研究的一部力作论文周祖谟先生曾指出：词汇是构成语言的材料，要研究词汇发展，避免纷乱，宜从断代开始，而又要以研究专书作为出发点。又如清人研究古韵那样，先以《诗经》一书为起点，得其部类，然后旁及《楚……基于差分优化语义相似度模型的智能组卷系统摘要：文章针对组卷系统中容易对同一语义内容但不同形式的题目多次出现在同一张试卷中的问题，提出了基于差分优化语义相似度模型的组卷系统。此系统引入语义相似度模型，在组卷的过程较好地……谈汉代文学作品中的女性形象与审美特征随着女性主义于上世纪八十年代传入我国并日渐盛行，该理论被广泛应用于文学研究和文学批评。这不仅为古代文学史的重新审视提供了新的视角，同时也成为古代文学研究的重要手段。女性主义在文……

<<<<<<－>>>>>>

探析会展管理专业中品牌塑造的必然性和特点论文影响美术绘画艺术创作的因素探析城市饮用水水源存在的问题与保护对策非语言艺术对实验教学的应用论文浅谈公共危机中的媒体功能与责任浅析孔子删诗之争神经认知语言学给汉语语音教学的启示体育这门生意世纪之交中国知识分子精神生态问题嫉妒，是发自心底的认可哥本哈根对世界和中国的教训浅析循证护理对老年白内障患者术前睡眠质量的影响

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁