“从大模型的角度来看,最大的变化不仅仅是参数的提升,更重要的是搜索增强功能。”

小P老师来了,教育大模型有自己的“繁花”?

2024-01-05 18:03:49发布     来源:多知网    作者:冯玮  

     来源|多知网

  作者|冯玮

  图片来源|网易有道

  繁华与热闹,刚好一年。

  2023年元旦,信息技术在迎来自身革命的同时也开始重塑未来社会的样貌,网易CEO丁磊第一时间向团队发送POPO(网易内部沟通软件)——一定要关注,因为业务会被颠覆。

  很快,网易有道相关业务团队在春节期间到门头沟京西古道民宿开了一场闭门会,“发生什么了?是不是没活儿干了?未来可期么?AI还存在么?”

  ……

  通用亦或垂直的教育相关模型及应用顺势扎堆挤上赛道,空气中弥漫着疯长的战略与野心、积蓄的人才实力和数据处理能力、还有一下被拉开又一下被缩短的距离、以及创业者与新战场的故事。

  “我们正在面临的是技术层面的颠覆。要快、 要赶时间。”这句话在网易有道CEO周枫的脑海中萦绕,持续了整整一年。

  而网易有道做了什么,很适合站在此刻再细细盘点。

  2023年5月,网易有道发布了基于“子曰”大模型研发的AI口语老师剧透视频,这也是AI口语老师产品雏形首次对外公开。

  2023年7月,网易有道推出教育垂直大模型“子曰”及大模型原生应用“虚拟人口语教练Hi Echo”、“LLM翻译”、“AI作文指导”、“语法精讲”、“AIBox”、“文档问答”。

  2023年8月,网易有道推出融合大模型应用的硬件设备有道词典笔X6 Pro。

  2023年11月,子曰教育大模型通过国家七部委联合发布了《生成式人工智能服务管理暂行办法》备案,成为首批通过备案的教育大模型。

  2024年开年第三日,网易有道宣布推出教育大模型“子曰”2.0版本,同时发布基于大模型研发的三个创新应用:AI家庭教师“小P老师”、有道速读、虚拟人口语私教Hi Echo 2.0,以及智能硬件新品:有道AI学习机X20。

  一系列新品的落地,一方面可以看出“子曰”在应用层的探索开始覆盖更多的学科内容、学习场景和细分工具领域;另一方面则是有道对大模型的布局节奏依旧保持在很快的节奏中——周枫将其总结为“认知”——“为什么有道的团队要最快速度推出大模型和相关应用,因为有道的财富不是代码、销售渠道,而是认知,越早出产品越能得到更多的认知……”

  此刻的有道,像极了虚拟世界的玩家,快步向前:也上分打野,也打破幻象,试图在教育场景下建立所想即所见的“完美世界”。

  01

  新角色登场:你好,小P

  在大模型行业高速发展的推动下,搭载大模型的教育硬件大多数官宣称已拥有语言理解、知识问答、逻辑推理等诸多能力,变成了“一位知识渊博还能因材施教的赛博老师”。

  大模型早已为教育智能硬件赋予了“灵魂”,让其从一个冰冷死板的学习机器变成了有温度的、有智慧的、能够精准带动学习的AI老师。

  但温度、智慧效果想要做好,却并不容易。

  仅作业辅导这一个环节来说,一个老生常谈的问题是家长在辅导孩子学习时一直面临两大困扰:一是家长本身对题目本身的理解不够深入;二是即便理解了题目,也很难向孩子解释清楚题目的知识点是什么。

  有道给家长的“疑难杂症”带来的解法,就是这场发布会上推出的小P老师。

  从底层基础来看,小P老师同样源自于子曰教育大模型2.0在4个方面(数据、模型、系统、应用)上3个能力层面的升级(口语对话能力、教育场景下知识问答能力、文字处理能力)。

  这也意味着,小P老师可以做到:

  1、多模态识别:学生不会的问题可以直接自然语言发问,同时支持文本、图片、音频等多种形式输入,均能识别。

  2、引导式讲解:基于有道子曰教育大模型,小P可以对全科题目进行智能讲题,支持知识点解析、思路逐步拆解和举一反三,同时避免直接给出答案。

  3、多轮交互:小P会通过提问启发式教学,与孩子对话并鼓励孩子继续交流,以激发孩子的思考和主动性。

  4、支持全学段、全学科的讲解:覆盖小初高的语文、数学、英语、物理、化学、生物、历史、地理、信息、科学10个学科。

  即:小P老师会拥有海量的知识储备并且融会贯通,才能够应对各科问题;能够用孩子们容易理解的、与学龄相匹配的方式去解释复杂问题;还能面对不同的孩子,换着花样、用适合的方法与孩子交流讲解。

  网易有道学习机负责人对多知解读,小P的底层技术不仅在于模型能力,有道同样花费较大精力在知识库和教学方法的打磨上,其目的在于与过往的拍搜产品进行区分。

  如果说拍搜类产品的判断标准在于识别度与准确率,有道给小P的要求则在于“不是答对,而是能不能教会。”

  “答对和教会有很大的鸿沟,这是小P在家庭场景下能帮家长解决的困扰。”产品负责人指出。

  用户使用过程中,交互越简单、越沉浸,意味着模型要做得越复杂。如何通过用户简单的几个词或一句话就能生成多层判断并恰好理解其意图,从而给出让用户满意的结果,高坦言,团队的确花费了很多精力。

  在下文中,我们也将对小P的真实能力进行测(刁)评(难)。

  02

  “一个不同的产品”

  AI大模型在教育智能硬件上最典型的应用载体就是学习机,过去两年,整个学习机赛道基本围绕着更大屏幕、更好的护眼能力、更多维的资源和精准学及AI能力进行提升。

  直到大模型出现,业内看到了大模型在交互能力、精准度和可靠性上对硬件的影响,而教育智能硬件有望成为AI大模型打开C端市场的重要突破口,以及AI大模型在教育智能硬件产品上的探索与应用,能够为其在其他场景中的落地提供借鉴和参考……

  但机会亦是挑战。

  对教育智能硬件来说,AI大模型这股东风可没有那么好借,内容安全、产品同质化等问题依旧摆在眼前。

  有道这次给出的答案是一台“三合一”模式的智能硬件,集学习机、学练机和学生专属电脑于一体——乍一看是AI学习机,但似乎又在大而全的形态下把这个机器变成了一个新的载体。

  一如周枫所说“这是一个不同的产品。”

  先来看下学习机模式。

  学习机模式本质上就是过往的学习机功能属性,不同的是,X20内置了“子曰”教育大模型应用AI家庭教师小P老师和虚拟人口语私教Hi Echo。

  内容上覆盖幼小初高全科多版本教材同步学、AI精准学,“诊、学、练、纠”四步掌握课内知识点,最大化提升学习效率,还有包君成语文拓展课、清北名师打造的精品课透彻讲解。

  资源上还有特色中英文图书馆,囊括了新课标必读、环球热门 IP 图书、获奖图书等 10000+ 正版优质图书均为免费。

  再来看下学练机模式。

  X20 内置了《5.3》战略合作资源,上千本正版中高考同源习题册的内容供孩子选择。

  为了模拟纸上做题练习的体验,X20 采用护眼类纸屏,搭配墨水模式,及4096级压感智能书写笔,跟平时纸上书写流畅度一样。

  最后是电脑模式。

  有道希望让X20成为孩子的第一台专属学习电脑。因此,X20内置了编程软件,孩子不仅可以用来做基础编程语言的学习,还能进行自由练习。

  同时可以通过预装的wps软件完成日常的展示作业(ps:在我们测试的过程中,一搬动机身导致倾斜,就出现了防抖动的护眼提醒,十分灵敏)。

  同时,孩子们还可以借助内置的打字软件,从小规范标准打字指法,而这一切都可以在家长管控下。

  硬件配置上:1600万像素的可升降摄像头,12.7英寸2K高清雾镀护眼屏,65w快充,都算得上是最优水准了。

  目前X20已经正式对外上市,定价:8G+256G,5999元;16G+512G,7999元。

  03

  “春节后,将再推新品”

  一年时间,网易有道在不断加快自己速度的同时,气质和方式也都在发生着巨大的变化。

  子曰项目刚刚开始,有道对大模型及应用的期待在于“有用”,能被大家使用起来已经迈出了艰难第一步。因此子曰一代有道选择的方向是做大模型能处理的事情。

  而大型模型的语言处理能力是最基础的,然后才是知识层和推理层,这也是英语产品最先上市的原因。

  “选择英语是最实际的选择”,周枫回忆并继续解读,当前的有道则已经进入到架构创新阶段,通过更为流行的架构去满足用户更多的需求,这其中就包括家庭辅导场景。

  C端对AI在教育领域应用的第一件事往往就是家庭场景下的相关任务,类似'我不会,你能教我吗?’的场景和需求。

  多知了解到,目前有道已经通过组合的解决方案达到实际效果水平的代际提升,从以前使用大模型仅能解决一半的题目到当前可以达到80%的准确率。

  周枫在媒体对话环节围绕大模型的变化也进行了补充解读:

  “大模型有智力和能力两方面的素养,它的智力随着它的参数变大和训练算法的提高一直在逐步提高,但是不能讲从5个月前到现在已有本质变化。”

  “有本质变化的是什么?其实是它学会了更多的本事,比如这次发布的RAG引擎,国内现在通行翻译为搜索增强,意思就是给大模型增加一个知识库,知识库里有相关的知识点,相关的描述和能力,再用上大模型的智力去处理之后,最后变成给用户的回答。”

  “RAG的好处是能够避免幻觉问题,或者说大模型的推理能力不足的问题,我们之所以现在才推出全科答疑的AI家庭教师功能,是因为过去5个月一直在建立这项能力。”

  “从大模型的角度来看,最大的变化不仅仅是参数的提升,更重要的是搜索增强功能。当然,还有一些其他能力,比如计算代数等。以前大模型在数学和物理方面存在难以克服的难题,但现在我们可以相对自信地说,我们已经找到了非常好的解决方案。”

  ……

  用务实的风格选择自然的方法,有道的“道”似乎又精进了一步。

  同时,周枫对多知透露有道即将在春节后推出搭载大模型能力的智能硬件新品,而这个被其团队看做“可能比过往各个产品线的销量都更多”的新品究竟是什么样子?

  一个月后的有道能否给出足够性感的产品?又能否带来对大模型及应用落地的新理解?

  总归值得期待。

  04

  测评:面对“刁难”,小P能否见招拆招?

  多知第一时间体验了有道AI学习机X20,我们选择了几个城市在2018-2023年的小中高考、期中期末考和重点校月考卷的不同学科的部分试题,与小P老师进行了多轮切磋。

  先说结论——输入模式多样,互动足够流畅、等待时间短,不直接给答案善于细致讲解,但也有被“小心机”绕晕的时刻。

  先来看一道数学题,一道典型的小学数学“鱼缸倒水题”。

  直接点击首页悬浮的AI小按钮,启动拍摄录入,X20会自动弹出AI一对一助教,唤起三种辅导功能,最新的AI家庭教师“小P老师”也在其中。当然,从首页的小P老师应用进入答疑界面也可以。

  一开始,小P给的解题思路更偏向高年级学生,我们让它换到适合六年级学生理解的模式,思路很快生成。

  这也很符合家长辅导孩子学习时常常遇到的困难:家长明白的解法孩子不懂,家长急,孩子更急。

  在小P的思路中提到了画图,不过暂时不支持输出图像,但仍然给出了生动的画法顺序和关键点,鼓励我们自己动手。

  我们找到了一位六年级的小学生体验,在他的试卷中找了一道错题进行测试。第一次体验的他很快上手,遇到没有理解的地方也能继续追问,整个过程十分丝滑。

  我们让这位同学又扫了一下他的听力错题,在没有听力原文的情况下,可以说难度直接拉满(甚至有些“刁难”的意思),看小P能否帮助这位同学梳理思路。

  扫描原题后,小P并没有直接解读错误的部分,而是围绕听关键词、捕捉具体信息、保持平稳心态等角度给出帮助。

  不过由于没有给听力原文,小P能做到这个程度已经很不错了,要是爸爸妈妈大概率没这个耐心…

  我们又找了一道小学语文作文题,先是故意摆歪看下它的识别能力。

  紧接着我们试图直接找小P要一份范文抄抄,但被小P老师温柔拒绝。

  但隔壁的小学生提醒我们,可以一部分一部分地让小P给范例,还得是小孩儿哥,会和人工智能斗智斗勇……

  小P老师难以避免地“上套”了。

  但从解析本身来说,小P老师还是围绕开放式小作文本身给出了足够丰富的参考。在我们测试的另一个文言文练习中,小P老师还给出了大量的诗词参考阅读,足见功力。

  再来看下物理题。

  与之前相似,小P老师很快指出了本题的考点和原理,以及运用公式推导的逻辑。

  当学生表达希望小P再进一步解答时,小P也对每个步骤进行了更细致的拆分,很有耐心。

  不同科目、不同类型题目都能做到“有问必答”并且支持“多轮互动”,小P这次的确展示出了它的能力。这也意味着,有道想要做的不仅在于对不同学段、不同学情的孩子的帮助,本质上是对不同孩子的不同引导。

  这或许也正是AI老师存在的意义。

  面对“千人一面”的教和“千人千面”的学之间的矛盾,上一轮 AI 教育科技公司试图扭转这个情况,但是简单地基于规则与知识点所提供的的自适应学习,并没有完全解决这个问题,更多是千人千面的“练”。

  这一次大模型带来的在意图理解、自然语言交流上的突破,或许很快能打破教育领域的困难,实现真正的“因材施教”。

  END

  本文作者:冯玮