口语陪练是大模型时代各家试水的重要场景之一。

基于大模型,谷歌搜索上线口语陪练功能

2023-10-27 19:44:10发布     来源:多知网    作者:徐晶晶  

  来源|多知网

  作者|徐晶晶

  图片来源|Pexels

  近日,Google Research(谷歌研究院)研究总监Christian Plagemann和产品经理Katya Cox宣布,Google Search(谷歌搜索)上线了一项新功能,帮助人们练习口语。

  据介绍,该功能将率先覆盖阿根廷、哥伦比亚、印度(印地语)、印度尼西亚、墨西哥和委内瑞拉的安卓用户。未来将陆续扩展到其它国家和语言。

  以往,谷歌搜索是通过提供翻译、下定义等功能来帮助人们提升词汇量。如今,用户可以利用谷歌搜索的英语口语陪练功能,将看到现实生活中的提示,使用提供的词汇形成自己的口语答案。在进行3-5分钟的口语练习后,会获得个性化的反馈,还可以勾选“每日提醒”来持续练习。该功能的另一种解锁方式是,与其他学习服务和资源(如个人辅导、App和课程)一起使用。

  据介绍,谷歌搜索的口语陪练功能是谷歌团队与语言学家、教师和ESL/EFL教学专家共同合作完成的。用户在真实的语境中练习词汇,词汇语料还会在记忆周期内不断重复以加强记忆。

  在个性化实时反馈方面,该功能可以对用户的回复进行分析,提供建议/纠错。还可以提供语法反馈改进建议,并提供了一组不同难度的示例答案。

  

  在口语对练的过程中,谷歌还提供了语境翻译功能,用户可以点击任何不认识的单词,根据上下文查看该单词的翻译。“这是一项复杂的技术难题。因为孤立的单个单词通常有多个含义,并且多个单词可以形成需要统一翻译的意义簇。我们的新方法翻译整个句子,估计原文和译文中的单词如何相互关联。这通常被称为单词对齐问题。”

  

  实现这一功能的关键技术是与Google Translate团队合作开发的一种名为Deep Aligner的新型深度学习模型。其基本思想是采用在数百种语言上训练的多语言语言模型,在人类专家提供的一组单词对齐示例上对新的对齐模型进行微调,用于几种语言对。由此,单个模型可以准确地对齐任何语言对,达到先进的对齐错误率(AER,衡量单词对齐质量的度量,越低越好)。与基于隐马尔可夫模型(HMMs)的对齐方法相比,这个单一的新模型显著提高了所有测试语言对的对齐质量,将平均AER从25%降低到5%。这个模型也被纳入谷歌的翻译API,例如,在Chrome中翻译pdf和网站的格式,YouTube字幕的翻译,并增强谷歌云的翻译API。

  为了能够对有口音的口语进行语法反馈,谷歌研究团队调整了书面文本的语法纠正模型,以用于自动语音识别(ASR)转录,特别是针对有口音的语音。关键的一步是在专家提供的语法更正下,在人类和语音识别系统的语音文本语料库上对书面文本模型进行微调。此外,受先前工作的启发,团队开发了一种新颖的基于编辑的输出表示,它利用了输入和输出之间的高度重叠,适合语言学习环境中常见的短输入句子的情况。

  对话的主要目的是清楚地传达对方的意图。因此,谷歌设计了一个功能,可以直观地向学习者传达他们的反应是否与上下文相关,是否会被同伴理解。这是一个复杂的技术问题,因为早期语言学习者的口语反应在句法上可能是非常规的。谷歌必须仔细地平衡这种技术,把重点放在意图的清晰度上,而不是语法的正确性上。因此,其结合了如下两种方法:

  

  由于学习者的能力水平不同,内容的语言复杂性需要适当调整。先前关于语言复杂性估计的工作主要集中在段落长度或更长时间的文本上,这与谷歌的系统处理的响应类型有很大不同。因此,谷歌开发了新的模型,可以估计单个句子、短语甚至单个单词的复杂性。使用这个模型,其可以根据学习者的能力水平适当地适应他们的学习进度。例如,使用其模型来标记示例,其可以微调系统,以生成不同语言复杂程度的口语提示。

  国内外已经有诸多公司切入口语陪练场景:今年3月,多邻国Duolingo接入GPT-4推出了新功能,提供了沉浸式对话场景和智能纠错功能;同样在3月,OpenAI投资的Speak宣布使用了GPT-4来支持其AI导师的部分功能,包括允许用户进行开放式对话,并提供语音、语法、词汇等方面的实时反馈;6月9日,科大讯飞发布针对广大英语学习爱好者的“AI口语陪练老师”讯飞语伴App;10月中旬,网易有道宣布推出搭载有道“子曰”教育大模型的虚拟人口语私教Hi Echo……

  谷歌切入口语陪练有其自身的优势——作为流量入口的搜索引擎,谷歌在全球搜索市场份额占据绝对领先市场地位,根据美国数据研究机构StatCounter的数据,2023年8月,谷歌搜索份额占据约92%的市场份额。

  

  (2023年8月各大搜索引擎在全球的市场份额,数据源自StatCounter)

  口语陪练是大模型时代各家试水的重要场景之一。