“教育AI的难点不在于会不会答,而在于能不能持续把人教会。”

有道周枫:从在线教育到AI教育,如何“主动驾驭每一次浪潮”?

2026-05-03 00:51:01发布     来源:周枫公众号    作者:周枫  

  编者按:

  本文转载自网易有道CEO周枫公众号。

  4月25日,周枫与与百川智能创始人、CEO王小川回到母校清华,参加了由清华大学计算机系主办、学生会协办的第443期时代论坛。

  在演讲中,周枫谈到,大模型的迅猛发展,正在驱动教育产业完成从“在线教育”到“AI教育”的质性跃迁。大模型能力经历了从知识问答,到思考答疑,再到行动的过程,尽管在聊天和编程领域已展现出惊人的能力,但周枫在现场抛出了一个引人深思的观点:“教育AI的落地要比聊天和编程更难。”

  他将教育AI的特殊性总结为四大核心挑战:学习过程的长期性、目标定义的困难性、利益相关者的复杂性,以及对不出错的极高要求。相比于一次性的代码生成或闲聊互动,AI教育是一个极其复杂的系统工程,必须让模型、内容、评测、交互与长期反馈形成闭环,才能真正发挥作用。

  “教育AI的难点不在于会不会答,而在于能不能持续把人教会。”

  以下为周枫分享全文。

  现场的同学们:

  大家下午好!

  非常荣幸再次回到清华,参加计算机系团委主办、清华大学学生会协办的第443期时代论坛,以学长的身份跟学弟学妹们做一些分享。

  我要讲的主题是《从在线教育到AI教育》——大模型出现之前的在线教育、有道以技术赋能教育的实践和我们当下针对AI教育的一些思考。

  早在大学阶段、师从郑纬民院士开始,我就一直围绕两条主线进行研究,一个是计算机系统和AI,另一个是教育科技和产品。2023年ChatGPT刚刚面世,比尔·盖茨就有一个著名的论断,AI未来最重要的四个应用领域是医疗保健、教育、生产力和生活。今天看,这是一个准确的预测,AI的确在这些领域爆发出了巨大的能量。

WechatIMG268.jpeg

  1 从“在线教育”到“AI教育”

  2022年9月教育部数据显示,中国有在校生2.9亿人,教职工1800万人;截至2024年底,国家财政性教育经费占国内生产总值比重,已经连续十多年保持在4%以上。

  但在AI大模型到来之前,在线教育所有的工作相当于只是“基建”——互联网技术解决了内容的海量分发与远程交互,第一次让“老师不在眼前也能上课”;师资、助教、答疑等层面的班级运营被数字化,教学开始从“手工作坊”变成系统工程;大班、小班、双师与不同客单价,验证了在线教育的可持续发展。

  以上分别对应的是通信、教学管理和商业模式的三个角度。它们的确立,为教育普惠呈现了全新面貌,打开了更大的想象空间。

WechatIMG269.jpeg

  与之对应的是,有道这些年深耕在线教育的一系列探索:网易公开课于2010年推出,中国大学MOOC于2011年上线。2016年移动互联网成熟后,有道精品课迅猛发展。2018年有道词典笔等硬件推陈出新,有道产品不断迈入家庭学习场景。2019年,有道在美股上市。2021年,在线教培的市场规模和行业关注度到达了历史峰值。

  可是在那以后,整个行业越来越能感受到在线教育真正的瓶颈:海量内容并不等同于学习效果,内容的工业化生产并不能替代个性化辅导,甚至内容越多,学生的负担越重。

  然而,我们常说的教育理想——“因材施教”,其核心在于“辅导、讲解与陪伴”,以及针对不同个体的个性化反馈。这些在实际中并不能完全做到,因此行业需要进行反思:究竟该怎么办?

  直到2022年底,ChatGPT来了,大家很自然地“希望用AI去更高效地做教育”,中国的在线教育进入到了AI教育阶段。

  有道也深度参与了由技术驱动的教育模式变革,最初的网易公开课让各地的学生都有机会学习清华等名校的课程,到直播课实现了低成本的远程交互,一个老师可以同时给成千上万的学生上课。

  再到目前,我们已经在技术的支持下进化到了视频答疑阶段。在有道AI答疑笔这个载体上,学生如果去问一道不会做的题,有道AI答疑笔可以生成个性化的讲解。

WechatIMG270.jpeg

  所以总结来看,上一轮在线教育确实解决了很多问题。它解决了大量内容的分享问题,解决了远程互动的问题,也让视觉、语音、搜索这些技术第一次大规模进入学习场景。但它并没有解决更深的问题。学习远不是依靠海量内容就能做好的,视频网站也许有很多的学习内容,但这并不天然等于最好的学习效果。真正困难的,是辅导、陪伴、个性化、节奏控制和长期反馈。生成式AI第一次让我们看到,在这些更深层的问题上,可能出现实质性的突破。

  2 教育AI比聊天和编程更难

  如果借用智能驾驶的分级来理解AI教育,我觉得它也会从低级别辅助,逐步走向更高水平的自动化辅导,覆盖越来越复杂的需求场景。

  从积极的一面看,我们有很多值得乐观的理由。2023年,模型的知识能力已经发生明显跃迁;2024年,模型的推理和思考能力快速提升;到2025年,模型的行动能力通过Agent的方式被释放出来。同时,多模态输入输出能力也在持续增强。聊天和编程这两个国民级应用已经证明,大规模AI产品是完全可能出现的。

  但是从另外一方面,我们也清楚地看到,教育AI比聊天助手和编程Agent更难。它面临着四大核心挑战,包括学习过程的长期性、目标定义的困难性、利益相关者的复杂性,以及不容有失的准确性。相比于一次性的代码生成或聊天互动,AI教育是一个极其复杂的系统工程,必须让模型、内容、评测、交互与长期反馈形成闭环,才能真正发挥作用。

  下面我想分享一下有道在这一领域的具体实践——教育Agent不会一夜之间在所有科目上都成立,它一定是按难度梯度逐步突破的。

  语言类学习是大模型可以很好支持的应用领域。大模型本来就具有强大的语言能力,还具备跨语言交互功能,十分擅长聊天,所以英语口语是一个很好的试验田。基于此,我们在2023年推出了AI口语老师Hi Echo,和网易游戏团队深度合作,将3D人物和AI结合,它解决了中国人学英语的一个非常关键的问题——缺乏语言环境,深受很多英语学习者的喜爱。

  其次是数学的问题,2024年,我们做了小P老师这样的数学模型,难度明显大了非常多,我们花了很多时间去打磨。刚好那一年ChatGPT-o1模型推出,我们也是国内最早去实践这个强化学习模型训练的团队,通过为模型增加针对性训练语料,以及采用RAG等知识库方法,使产品达到用户可接受的基础质量。随着大模型推理能力的提升,现在理科答疑的问题已经很好地解决。

  从模型能力本身看,我们也经历了一个持续演进的过程。

  在AI浪潮前期大家关注模型的重点是参数有多大、算力有多强,但我们注意到一个现实问题,高性能大模型的部署成本极高,这可能会让低收入地区的学生望而却步,从而加剧“数字鸿沟”。所以,我们从一开始的目标就很明确,要打造一款专注教育领域、人人可用、低成本且高质量的推理模型。只有把门槛降下来,教育公平才会有真正的抓手。

WechatIMG271.jpeg

  到具体版本上:

  2023年,我们做子曰1,核心是用更小的模型尺寸做高质量知识问答;

  2024年,推出子曰2,重点优化英语学习的综合能力;

  2025年,子曰3正式发布,尝试基于强化学习实现高质量理科答疑。

  在Benchmark图表中可以看到,它在数学推理任务中的表现已经处于顶尖水平。今年,我们的重心聚焦在多模态方向。我们正在优化视觉能力,重视复杂解题和交互式答疑的体验。

  今年我们又推出了有道龙虾、有道宝库等解决办公、深度学习领域复杂任务的AI Agent。3月,OpenClaw创始人Peter Steinberger在海外社交平台公开点赞了有道龙虾,这也是国内同类产品中唯一获此认可的项目,近期我们也率先接入了Deepseek V4、kimi2.6这两个顶级模型。

  保持审美力和判断力驾驭AI浪潮

  最后,和大家分享我的一些观察和感悟。

  我认为,未来三年Agent将成为人机交互的核心,教育行业会像编程行业一样迎来代表性的Agent产品;学习硬件将从简单的“内容容器”升级为懂孩子的“家庭老师”。 而随着大模型技术壁垒的突破,推理成本与应用落地将共同驱动算力与场景的深度融合。

WechatIMG272.jpeg

  我想跟大家共勉的是,在技术浪潮面前,主动拥抱变化。不仅要懂技术,更要懂生活。让我们保持审美力和判断力,对现实世界问题的敏感性。唯有勇于跨界、打破学科围墙,同时对每一门专业怀揣敬畏,才能驾驭每一次技术周期,在交叉融合中实现创新,做出属于这个时代的耀眼成绩。