林远东向多知网展示了其中的一个即将完成的项目,可以看出,人机交互的一些想法已经成型。他表示,驰声现在也在做这样的解决方案,通过与教育机构的提供的内容相结合,探索更多技术与教育碰撞之后的可能性。

驰声科技林远东:评测将推动语言培训将走向人机交互

2015-03-30 08:21:47发布     来源:多知网    作者:初骊禹  

  多知网3月30日消息,无论是不是再教育行业,你一定听说过这些名字:新东方、环球雅思、外研社、51Talk……但“驰声科技”这个名字,对大多数人来说,还是陌生的。其实,驰声科技,是站在这些知名公司背后,为他们提供语音评测技术的公司。有了语音评测技术,学生对着电脑说英语,并得到相应分数的场景才能得以实现。

  多知网采访了驰声科技CEO林远东,他阐述了语音评测技术的应用及未来发展方向。

   一个工科生的教育梦想——基于教育的语言技术公司

  其实,从介绍上看,驰声科技是一个年轻的公司,2014年5月成立,公司的前身是思必驰口语事业部。

  最初,在剑桥教书的时候,林远东做了一个叫做Speachi的口语作业系统,这个是针对发音系统评测和与学生互动的软件,思必驰来源于就是Speachi的发音。后来,演变到Audio course plus,再到后来的AI-Chinese,这是林远东想的是能够帮助老师在教育上做一些事情,不仅可以降低老师的工作量,同时,也能够提高教学的效率。

  那时的林远东和他的团队在推广上的思路类似现在的一起作业网,主要是想通过和学校的合作,将产品推广铺开。但是,那时他们经历了一个艰难的长期过程。因为针对学校的销售通常周期很长,加上学校使用和等学校预算到位的时间,已经过去了一、两年。同时,他们发现,在对外汉语这个市场上,英国只有50个学校在开这个课,市场并没有想象中大。

  到2010年,公司战略调整,林远东决定专注做擅长的语音评测技术,因为做产品涉及的面比较广,不仅有内容还要有市场营销,使得公司对于语音评测技术本身关注不足。至此,思必驰确定定位是要做语音技术公司。

  之后,思必驰卖掉对外汉语的部分,转向国内做语音评测技术的授权,不再直接做产品,而是希望To C的公司做内容,和英语听说方面的事情。

  2011年,思必驰正式转向国内,并靠新东方的一单,敲开语音评测技术大门,但其中经历的过程,却并不轻松。

  在林远东带着他的团队转向国内的时候,国内已经有比较成熟公司的先入为主,林远东希望通过抢占山头,和新东方这样的知名公司的合作,进而以和合作案例,去获取更多公司的订单。

  当时,新东方在线有一个叫口语风暴的频道,已经在和与驰声业务类似的思昂教育合作。几轮接触下来,新东方在线方面不愿意放弃已有的成熟合作伙伴选择驰声科技的技术。

  林远东想了一个办法,建议新东方在线开始另一个栏目的筹划。最终,驰声科技靠“无插件解决方案”胜过了当时的思昂教育,“其实,‘无插件解决方案’听起来挺玄乎,其实就是基于当时浏览器上的flash插件集成了语音评测技术,最终实现不需要插件就可以做语音的评测。”林远东坦言。

  在一个月赶工后,驰声科技与新东方的合作项目上线,并取得了不错的反响。

  对于2011年,林远东表示对每一个项目都印象颇深,对于驰声来说,2011年是破局的一年。这一年,驰声共完成了15项合作,合作方涵盖新东方、环球雅思、外研社、雅信达、海云天等。这些公司都是在各自领域里,做的比较领先的公司。

  同年,驰声获得了清华启迪和联想的投资。

  后来,2012和2013年,驰声均实现了三倍的增长,2014年也实现了超过两倍的增长。林远东介绍说,现在市场上每10个用到语音评测技术的应用,就有4个使用了驰声的技术。2014年,一天有1000万人次在使用驰声的语音评测技术,总用户数量接近2000万。

  林远东坦言,公司发展过程中,一共有两次,他面临是否要只做教育相关语音评测技术的选择,选择的结果是,第一次,他选择在思必驰建立口语事业部,并主导了所有项目的推进。第二次,他选择将思必驰交给合伙人,将驰声剥离出来,并继续带领驰声做教育领域的语音评测技术公司。

   语音评测技术到底是什么?

  说到语音评测技术,林远东打开了话匣子。可以感觉到,他对技术和教育这两方面的问题,格外感兴趣,神情就像足球运动员马上就要破门得分般兴奋。他结合驰声科技的发展,向多知网解释了语音评测技术的四个发展阶段。可以看出,这些阶段与驰声的发展是紧密相连的。

  第一个阶段是对语音层面的评测。“这就好比有人说‘你好’,计算机原来并不知道汉语的‘你好’要怎么说,所以需要教给计算机‘你好’这个词的发音是怎样的。收集了足够多各种人说“你好”的语料后,计算机会识别出那些和‘你好’这个发音无关的发音,从而锁定‘你好’这个词本身的发音,而剔除掉由于说话者的年龄、性别等产生的发音音色、声音大小等因素的差异”林远东说。

  第二个阶段是半开放的语音评测。也就相当于是选择题。主要围绕口语表达能力分为三个部分,这三个部分分别是表意、表达法和发音。同样基于大量语料,通过这三个维度的评测,计算机不仅可以判断学生在发音上是否准确、还能够在句子意思和表达是否正确方面给出评测。

  第三个阶段就是表达能力评估。在这一阶段,语音评测技术可以对用户自由表达的的所有语义进行评分。在这一点上,各家公司的思路是不一样的。

  有一种思路是,先用语音识别的技术将语音转换为文字,然后用作文批改的思路去对这段文字打分。有一部分公司现在也在用这样的思路,但是在具体实施的过程中,这样的思路却是有问题的。因为这个过程一共包含两步,假设第一步的识别率是30%-40%,第二步的批改正确率是50%—60%,这两者相乘后,结果只能达到10%多一点。

  而驰声的思路,是利用语音评测技术直接打分。林远东表示,对于这种主观题的评分,即使是老师评分,他对于同一份试卷两次不同的打分都是有差异的。在一次大规模的实验中,将驰声的数据与人的数据对比,驰声的评分容差一致度与PS相关系数均超过老师。这两项因素也是判定一个评测是否有效的重要指标。

   语音评测技术还会有哪些发展?

  林远东认为,现在教育市场中普遍采用的是第一阶段的技术,还仅仅停留在语音评测的技术上,主要以作业评测为主,现在市面上的一起作业、口语100,基本上都是这个思路。但是他认为,接下来的教育还有很大的发展的空间。

  在第一代评测技术应用的基础上,可以延伸至语音的纠错和指导反馈。当语料库的数据足够大了以后,可以知道学生在某个单词或者某个句子中,都会犯什么样的错误,进而为学生推送相应的知识点。

  之后,知识的传递和技能的习得将变的非常廉价,重要的是主观反馈的闭环。未来,老师将不再主要承担传递知识和教授技能的任务。随着,主观评估的可观化和标准化,无论是知识的传递还是技能的习得,可以更多地通过人机交互来实现。

  林远东认为,之后学生的学习过程,会集中在大数据挖掘和学习形式模式识别上,在考试和学习过程中,对学生的行为进行分析,并由老师最终对他们进行指导。

  现在,驰声也在探索第四代语音技术,并在今年会有一些成果出来。同时,驰声也尝试做了一些教育的解决方案。驰声科技有一个研究小组,负责设法实现各种教育的想法,这些想法很多来自林远东本人,另外还有一些教育行业内的人士,负责提供想法,这个小组,则负责实现。

  林远东向多知网展示了其中的一个即将完成的项目,可以看出,人机交互的一些想法已经成型。他表示,驰声现在也在做这样的解决方案,通过与教育机构的提供的内容相结合,探索更多技术与教育碰撞之后的可能性。(多知网 初骊禹)