人机对话系列1:人机对话“凭什么”考查学生的听说能力?

来源:衢州日报 2018-09-14 09:38

  记者 吴昊斐

  人机对话势在必行

  据统计,我国学生从小学到高中,累计学习英语的时间超过3000小时,但高中毕业时,英语平均成绩只有70分左右,且口语能力普遍欠缺,“哑巴英语”现象突出。这既与我国传统英语教学侧重语法、词汇等语言知识的传授、忽视语言能力的培养有关,也与考试内容上偏重语言知识,以笔试为主有关。增加口语测试比重,转变英语能力考核形式,采用高效准确的评分机制势在必行。

  “以前的听说考试,两个考官对着一个学生,整个过程费时费劲。后来改进成一个考官听考生的口语录音,每个人戴耳机一天听200份录音已疲惫不堪。随着自然语言处理、语音识别等技术的发展,基于人工智能自动评分的听说考试既能有效降低成本、又能实现准确评分,逐渐形成趋势。”深圳市海云天科技股份有限公司衢州负责人赖红建介绍。

  “人机对话简单地说,就是用机器来考试和评分。”衢州市教育考试院相关工作人员介绍,人机对话的考场一般设置在考点学校的计算机教室内,考生一人一机,通过计算机完成听力和口语测试。以口语考试为例,考生根据题目要求进行朗读、叙述,计算机会自动录音;答题完成后,计算机将自动上传答案,由软件系统对其进行评分。

  去年年底,浙江省教育厅发布《关于进一步推进高中阶段学校考试招生制度改革的实施意见》。《意见》提出,从 2017 年秋季初一新生入学开始,在全省范围同步实施中考招生制度改革。其中要求,到2020年,各地全面开展外语听说能力人机对话和科学实验测试。目前,浙江省已有温州、宁波、嘉兴三地市中考已采用英语听说能力人机对话测试,从2019年起,衢州市中考英语听力测试也将正式变为英语听说能力人机对话测试。

  人机对话考些什么内容,在本报9月13日5版中已有报道,但为何要使用人机对话形式来考查学生的听说能力?人机对话的测试是运用什么样的评价系统来保证考试的公平公正?记者做了深入的了解。

  智能评分系统更客观公正

  口语作为相对主观的项目,用软件系统评价该如何做到客观公正?赖红建介绍,这是基于海量数据及强大的人工智能服务器基础上架构出来的。作为衢州市英语中考听说能力人机对话测试专用系统,海云天英语人机对话考试系统拥有其优越性和权威性。

  “根据相关测试,机器评分和阅卷专家评分的相关度高于98%,意味着它的评分水平高于绝大多数的普通阅卷员。”赖红建直言,智能评分系统不受情感因素影响、不会疲劳,所以它的评分也更加客观、公正。

  语音的特征主要有语音的完整性、准确性、流利性及韵律性。通过语音识别、语音分析、人工智能、分词技术并结合语言教育学,将一段语音的所有特征都提取出来,然后再通过评价层的数据分析将真实的考生录音和成绩数据反算出所有特征相应的权重,这个权重实际上反映的就是量化表达出来的评分标准。评价层主要分两部分,一块是专家评分标准采样,这个采样是在多样且权威的数据中生成,另一块是人工神经网络,基于庞大的大数据生成相对客观的标准,在这两部分融合评价下自动生成评分结果。

  作为中国最大的“考试评价”及“教育大数据”公司,海云天凭借21年的教育行业经历,参与国家相关考试标准的制定,为全国18个省的高考,130多个地市的中考,14个省的研究生考试,全国大学英语四、六级考试等各种考试提供技术服务,年考试及评价数据处理量超过2亿人科次。“在这样的海量数据及强大的技术支撑下,海云天人机对话考试系统已应用于多地中考英语口语人机对话考试中,获得大家的一致好评。”赖红建介绍,目前在浙江省内,嘉兴、宁波英语中考人机对话都是由海云天提供技术服务,如今衢州也成了第一梯队的成员。

  可以预见的是,未来还会有更多的地市将加入人机对话的大军,用一位信息技术老师的话来说,英语人机对话是中考改革中教育信息化体现最为直观的改革,也是对目前传统考试模式的颠覆。无论如何,中考正在跨入“人机对话”时代。

[责任编辑:吴红梅]    

扫二维码分享到手机

衢州新闻网微信公众号

衢州新闻网微信公众号