2013年第3期 文章编号:1006—2475(2013)03-0212-03 计算机与现代化 JISUANJI YU XIANDAIHUA 总第211期 基于分词匹配的主观题自动评阅技术研究 冯光,乔丹丹,常静怡 (安阳师范学院教育信息技术与传媒学院,河南安阳455000) 摘要:目前,计算机自动阅卷系统中,针对简答题、论述题等主观题的自动评阅技术发展尚不成熟。为了解决主观题自动 评阅系统中存在的准确度问题,本文采用基于最大正向匹配的中文分词提取技术和关键词匹配技术实现一种性能稳定 且准确率较高的主观题自动评阅系统。实验测试表明,本文的主观试题自动评分方法基本可以满足系统设计的需求,是 有效可行的方法。 关键词:中文分词;最大正向匹配;主观题;关键字匹配 中图分类号:TP391.1 文献标识码:A doi:10.3969/j.issn.1006-2475.2013.03.054 Research on Subjective Question Automatic Marking Technology Based on Word Segmentation Matching FENG Guang,QIAO Dan—dan,CHANG Jing—yi (Institute of Educational Information Technology and Communication,Anyang Normal University,Anyang 455000,China) Abstract:Nowadays,because of the immaturity of the automatic marking system technology,some problems still exist when deal— ing with the subjective problems,such as short—nsawer questions,essay questions,etc.In order to improve the accuracy grade of assessing the subjective question automatically,this paper presents a kind of automated marking system with stable pefrormance and hi accuracy by adopting Chinese word segmentation extraction technology and key word matching technology which are based on forward maximum matching algorithm.Experimental results show that using this kind of automated marking system can satisfy the demand of system design and it is very effective and feasible. Key words:Chinese word segmentation;forward maximum matching;subjective questions;keyword matching 0 引 言 计算机自动评阅是指利用计算机程序模拟人工 评阅的标准和内部过程对开放式题目和表现性活动 后的考生词语与标准答案切分的词语进行对比,完成 对考生主观题答案的自动评阅,实现一种主观题评阅 功能,并利用实验结果验证该系统的主观题评阅性 能。 进行评阅及反馈¨ 。对客观题的判阅主要是对答案 字符的直接匹配,因此实现技术简单,应用范围较广。 但对主观题的评阅涉及分词技术与关键词匹配技术。 由于中文语义的表述在拆分时容易引起歧义,因而, 1现存的中文分词技术 在主观题自动评阅系统中,中文分词具有非常重 要的作用。所谓中文分词,就是将中文语句中的词汇 中文主观题自动评阅技术是当前的一个研究热点。 近年来,随着自然语言理解等理论研究的深入,已经 提出了一些相对较为成熟的主观题评阅算法。本文 主要利用基于最大正向匹配的中文分词技术和关键 字匹配技术,通过中文分词技术可以将考生答案的句 子切分成不同的词语,再经过关键字匹配,即将切分 收稿日期:2012.11-26 切分出来的过程 J,即将一个连续的汉字序列按照 定的规则和要求切分成一个一个单独的词 J。而 一由计算机自动识别文本中的词,实现上述中的处理过 程的技术就是中文分词技术。 如今国内外的学者们对中文分词技术进行了广 泛的研究,但是也面临着需要解决中文分词的难点问 基金项目:安阳师范学院大学生创新基金资助项目(ASCX/201 1-Z22) 作者简介:冯光(1989-),男,河南汝南人,安阳师范学院教育信息技术与传媒学院本科生,研究方向:教育技术学;乔丹丹 (1989一),女,河南沁阳人,本科生,研究方向:教育技术学;常静怡(1990一),女,河南伊川人,本科生,研究方向:教育技术学。 2013年第3期 冯光等:基于分词匹配的主观题自动评阅技术研究 213 题。对主观题自动评分技术的研究,主要涉及的领域 是自然语言处理技术 J。自然语言处理是一门前沿 评阅系统,其具体的设计如图1所示。 的学科,它主要涉及计算机、中文、数学、心理学等多 个学科门类,是一门交叉学科 J。对主观题自动评 分的研究,本文根据各个学者的文章总结出中文分词 的难点问题:(1)中文逻辑性不强 J。比如在句子 “让警察逮着是小事,你要是在我手里有个三长两 短,我可是死罪”,本句是暗含一种假设关系,并且省 略了主语“我”,在后面的句子中还包含转折关系,这 就是句子的逻辑性比较差。(2)中文词与词之间没 有显式分割标记。比如在句子“超市里的羽毛球拍 卖完了”,正常情况下的分词结果应该为:“超市/里/ 的/羽毛球拍/卖/完了”。但是“羽毛球拍卖”也可以 分为:“羽毛 拍卖”,这样的分词是不正确的。 现存的中文分词技术可以分为3大类型 J:(1) 机械分词方法 J,该方法又称为字符串匹配的分词 方法。(2)基于理解的分词方法。(3)基于统计的分 词方法。按照优先匹配的词长和扫描方向,又有3种 常见方案:正向最大匹配、逆向最大匹配、双向最大匹 配。 现存分词技术算法优缺点比较如表1所示。 表1现存分词技术算法优缺点比较 算法名称 算法优点 算法缺点 文献 错误率高,且不能 正向最大匹配 简单,易实现 准确处理歧义切 [2] 分现象 简单,易实现,错 不能准确处理歧 逆向最大匹配 误率低于正向最 义切分现象 [2] 大匹配 改进的最大正 简单,易实现,体 很多词仍然不能 向匹配 现长词优先原则, 得到正确的切分 [9] 有利于减少歧义 集合正向与逆向 算法实现复杂,且 双向最大匹配 匹配算法,错误率 不能准确处理歧 [10] 低。算法较完善 义切分现象 基于理解的分 在一定程度上,有 效处理了歧义切 实现困难且目前 [11] 词方法 分现象 正处于研究阶段 基于统计的分 有效解决了歧义 词方法 切分现象,且准确 实现困难且目前 正处于研究阶段 [12] 率较高 2主观题自动评阅系统 对于一个主观题自动评阅系统来说,影响其评阅 精度的关键技术包括中文分词、关键字匹配等技 术 ]。本文设计了一种基于最大正向匹配的主观题 图1系统整体设计图 3本文方法 3.1最大正向匹配技术 本系统采用的是最大正向匹配技术。正向最大 匹配法,亦称MM法¨ ,其基本思想是这样的,假设 自动分词词典中的最长词条是i个字,则取被处理材 料当前字符串序列中的前i个字作为匹配字段,查找 词典,若词典中存在这样的一个i字词,则匹配成功, 匹配字段被作为一个词切分出来;如果在词典中找不 到这样一个i字词,则匹配失败,匹配字段去掉最后 一个字,剩下的字段重新进行匹配,如此进行下去,直 到匹配成功,也就是完成一轮匹配,切分出一个词。 其具体的实现算法如图2所示。 图2正向最大匹配算法流程图 本文采用正向最大匹配的算法,作为最为古老的 分词算法,和其他算法相比,最大正向匹配算法具有 以下几个优点:结构清晰明确,易于建立。作为一种 分词的重要算法,在实践的过程中,可以方便有效地 建立数据结构,虽然简单,但是有效易读。该算法的 最大优势就是可以根据字符串序列的大小把所有可 能的词都切分出来,该算法切分得比较仔细,并且切 分时都会根据词性来切分,不同词性的编码不同,还 为关键的词添加了权重,这样为以后的匹配带来了好 处 。 在本文中采用的正向最大匹配的算法中的匹配 214 计算机与现代化 2013年第3期 第一组语句m … 第二组语 :回回回…囱 4实验结果与分析 表2测试结果显示和对比 测试1 测试2 测试3 学生答 学生答案: 学生答案: 学生答案: 案输入 政治和文化中心 珠江黄河 美丽的校园 学生答 学生答案拆分 学生答案拆分 学生答案拆分 案拆分 政治和文化中心 珠江黄河 美丽的校园 标准答 标准答案输人 标准答案输入 标准答案输人 案输入 政治和文化中心 长江黄河 美丽和谐的校园 标准答 标准答案拆分 标准答案拆分 标准答案拆分 案拆分 政治和文化中心 长江黄河 美丽和谐的校园 结果 相似度的百分比 相似度的百分 相似度的百分比 显示 为:100.0 比为:50.0 为:75.0 如表2所示,采用本文方法对主观题进行测试, 实验结果表明,该系统能满足对主观题的评阅,系统 有效。其中,测试1与测试2为系统正常的显示结 果。在测试2中,学生输人的答案为“珠江黄河”, 在对学生答案通过最大正向匹配分词后得到的拆分 结果为“珠江”、“黄河”两个词。而标准答案为“长江 黄河”,通过分词拆分后得到的答案拆分结果为“长 江”、“黄河”两个词。因此学生答案和标准答案有1 个关键词即“黄河”匹配成功,所以通过相似度计算 得到的结果为50%,即在正常情况下,学生答案和标 准答案中只有一个相同,而在标准答案中有两个关键 词,所以其匹配度应该为50%,这和系统计算的结果 一样。 但根据表2中的测试3所示实验结果,说明系统 存在缺陷,有待进一步完善。在正常情况下,“美丽 的校园”,经过分词应该分为“美丽”、“校园”,而标准 答案“美丽和谐的校园”应该分为“美丽”、“和谐”、 “校园”3个词,因此,学生答案和标准答案关键字匹 配有两个词相同,即其相似度为2/3,也就是66%,而 系统显示出的百分比为75%,比正确的相似度的百 分比要高,存在误差。原因在于,系统中存在缺陷,不 能有效地将词性区分开,尤其是不能把“的”、“和”、 “也”等单个字排除。由于系统不能辨识出这些单个 字不是词语,就把这些单个字当成词来处理,从而使 “美丽的校园”分为“美丽”、“的”、“校园”3个词,标 准答案也变为“美丽”、“和谐”、“的”、“校园”4个词, 系统将“的”视为一个单独的词,所以认为学生答案 和标准答案的4个词中有3个是相同的,即3/4,也 就是75%。所以系统没有正确地将词性分开,导致 系统测试相似度有误差。如何准确地将词性分开,提 高系统相似度的准确率,这是下一步工作的方向。对 于如何提高分词词性的准确率,应当重点针对语句的 逻辑性进行研究,根据其逻辑性,用明显的分隔标记 符将词分开,以提高分词词性的准确率。对于提高近 义词之间的匹配准确率,可以建立独立的近义词库, 根据其意义的相似程度来判定其准确率。 5 结束语 中文分词技术和关键字匹配是实现主观题自动 评阅系统的关键和基础。本文采用最大正向匹配的 分词技术和关键字匹配技术实现对学生主观题的评 阅。经过实验测试显示,系统能准确地对学生的主观 题进行评阅,满足系统设计要求,并有较高的准确率。 参考文献: [1]李学俊.基于人工智能的主观题自动评分算法实现 [J].江南大学学报:自然科学版,2009,8(3):292 ̄95. (下转第219页) 2013年第3期 朱克武:Ofifce网络考试系统的研究 219 取收件人、主题、正文等信息,而这些信息正是考核的要 求,因此使用保存邮件的方法,实现对邮件的考核。 3.3考试结束 期的设计目标,在系统运行的过程中,还会出现各种 各样的问题,需要不断地完善。 参考文献: 考生单击“交卷”按钮,表示考试结束;或考试的 时间到,考试结束。首先,需要把Word等应用程序 关闭,如果没有关闭,表示某个文件还在继续使用, WinRAR程序在压缩这个文件时,会提示压缩失败, 导致整个考生文件夹压缩的失败。其次,压缩整个考 生文件夹,生成一个Far压缩文件,不是一个一个文 件上传,而是压缩后的一个文件。读取该文件,将它 [1]杜少杰.基于形式语言的Word操作题自动阅卷方案及 其实现[J].唐山师范学院学报,2006,28(2):78-79. [2] 李爱玲.基于VBA的Word文档自动评阅技术研究 [J].科学技术与工程,2008,8(17):83.85. [3] 周建良基于WinPcap库的通用程序设计模型[J].计 算机系统应用,2007,11(2):83.85. [4]朱耀强.Word操作题自动阅卷功能的实现[J].宁波职 业技术学院学报,2007,11(2):811—812. [5]刘中宇,黄福君,等.PowerPoint操作测试自动评价技术 研究[J].计算机技术与发展,2009,19(2):237-239. [6]吴丰科,苏厚勤,朱汉群.Excel对象模型在统计报表中 的应用研究[J].计算机应用与软件,2009,26(2):201. 2o4. 上传到服务器,修改考生的考试状态。第三,删除考 生文件夹,包括该文件夹下的所有文件和子文件夹, 避免考试信息泄漏。 学生再用学号登录时,服务器根据考试状态,判 断该考试是否考试结束,如果考试结束,则在客户端 的界面上提示考试结束。 [7]吴亚坤,郭海旭.Office文档自动评分的研究与实现 [J].辽宁大学学报,2008,35(4):334-337. [8]李文江.利用VBA实现对Word文档的自动评分[J]. 重庆文理学院学报,2007,26(2):73 77. [9]赵晓峰,肖丹.基于XML与ACTIVEX技术的Office操 作自动评分系统[J].计算机与数字工程,2006,34 (12):178-180. 4 结束语 办公软件网络考试系统是一个非常复杂的系统, 涉及的内容比较多,有文件管理、SQL数据库知识、 Excel的应用、Socket套接字、WinRAR压缩和解压、 进程和线程的管理等多方面的知识,重点和难点是网 络通信,即Socket套接字的使用,如果没有套接字,也 就不称为网络考试系统了,是一个单机版的系统。本 系统还需要解决侦听数目的问题,一般是lO个,如果 同时有20个客户端要求连接,则只有排在前面的1O 个给处理,出现客户端连接慢的现象。本系统还需要 解决连接客户端个数的问题,由于没有采用线程池技 术,最多可以连接64个客户端。总之,网络考试系统 需要考虑的问题非常多,本系统主要是解决上传和下 载的问题,基本上实现了网络考试的功能,达到了预 .・●[10]李菲.考试系统中Excd操作题自动阅卷的实现[J]. 辽宁师专学报,2O09,11(1):46,97. [11]邵小兵,廖慧芬.Office实践操作自动评分的实现[J]. 计算机与现代化,2005(12):135—136. [12]邓振杰,李瑛.VisuM Basic程序设计实用教程[M].北 京:中国铁道出版社,2010. [13]周晓宏.VisuM Basic 6.0程序设计实用教程[M].北 京:高等教育出版社,2007. [14]孙俏.VisuM Basic 6.0程序设计[M].北京:中国铁道 出版社,2011. [15]刘炳文.VisuM Basic程序设计教程[M].北京:清华大 学出版社,2005. ● ’t..・●”.__.● ‘...・●‘・.‘●●● ,...●●‘’...・●‘.●。‘...●● ‘. ..●●(上接第214页) 31(11):2663・2666. [2]周程远.中文自动分词系统的研究与实现[D].上海: 华东师范大学,2010. [3] 韩月阳,邓世昆,贾时银,等.基于字分类的中文分词的 研究[J].计算机技术与发展,2011,21(7):29—31,35. [4]梁晓诚,岳晓光,麦范金,等.基于自然语言处理的主观 [9] 唐培丽,胡明,张勇.基于中文文本主题提取的分词方 法研究[J].吉林工程技术师范学院学报,2005,21 (2):34—36. [10]麦范金,李东普,岳晓光.基于双向匹配法和特征选择 算法的中文分词技术研究[J].昆明理工大学学报:自 然科学版,2011,36(1):47-51. 题评分算法研究[J].昆明理工大学学报:理工版, 2010,35(2):81—84. [11]曹卫峰.中文分词关键技术研究[D].南京:南京理工 大学,2009. [5] 南铉国.基于语句相似度计算的主观题自动评分技术 研究[D].延吉:延边大学,2007. [6]谭冬晨.主观题评分算法模型研究[D].成都:电子科 技大学,2011. [7]刘件,魏程.中文分词算法研究[J].微计算机应用, 2008,29(8):l1-l6. [12]陈明华,殷景华,舒昌,等.基于正反向最大匹配分词系 统的实现[J].信息技术,2009(6):124—127. [13]佟振宇.主观题自动阅卷系统的研究与实现[D].沈 阳:沈阳工业大学,2009. [8]李玉红,柴林燕,张琪.结合分词技术与语句相似度的 主观题自动判分算法[J].计算机工程与设计,2010, [14]林琳.单向扫描分词算法研究与主观题评分系统实现 [D].大连:大连理工大学,2008.