学而思学习机推出“纸屏互动”：桌面机器人AI老师，上岗

2025-11-19 10:06:27发布来源：多知作者：王上

　　来源|多知

　　作者|王上

　　学习机行业角逐，已切换至新维度。

　　近日，学而思学习机对外介绍了其“纸屏互动”的产品逻辑。可以看出，学习机已突破了“平板”的交互模式，而是成为了一个“长眼睛”的机器人老师的载体。

　　AI老师发展到今天，各家已有不同的定义。好未来的路径，可以从学而思学习机“纸屏互动”中，看出端倪。

　　纸屏互动是一套“软硬一体化”的AI老师解决方案，简单来说，用户将一套卷子放在学习机面前，拍一拍小思的“智慧岛Pro”，指着桌面纸上的一道题目问：“这道题怎么做?”小思AI老师便从头至尾像一位真人家教一样讲解，过程中有AI老师的提问，学生的书写，AI老师还会说“我看看你写的有没有什么问题”，经过多轮问答与反馈，直至完整讲解完一道题目。

　　“智慧岛Pro”像是集合了学习机的眼睛、耳朵和嘴巴，不用解锁开机、再打开摄像头，这对于学生来说，使用的门槛极大降低。

　　学而思学习机小思产品部负责人伊丽君提到：“‘小思AI 1对1’是行业领先的软硬一体超拟人交互的‘AI老师’，学而思学习机则在行业率先做到纸屏互动分步骤批改和讲解的学习机。”

　　从技术上来看，覆盖了从感知、认知到决策与生成的全链路，包括OCR技术、语音交互、版面分析与指尖识别、九章大模型等底层模型等，这背后依赖自研的高质量数据与算法‌。

　　“孩子最核心的学习场景还是发生在纸面上。” 学而思学习机学习系统负责人李通说，这是整个产品设计的基础。

　　从学而思学习机的迭代可以看到学习机的演化路径：从最初的优质内容资源，解决“学什么”的问题，到AI技术的注入实现了“精准学”，通过初步解答了“如何学”的问题，而今，学而思学习机已然迈入第三阶段，它成为了一个高度拟人、实时互动的AI Tutor载体。

　　这意味着，在新范式下，学习机在形态上或许仍是一台置于桌面的设备，但本质已经发生改变，已经从“工具”跃升为“AI老师”。

　　01 “纸屏互动”是未来?

　　学而思为什么将最前沿的AI能力聚焦在一纸张上?

　　决策的起点，源于学而思团队对用户真实学习场景的观察：

　　第一，无论科技如何演进，当前全球主流的教育体系，尤其是学校的作业、练习和考试，仍然建立在纸质基础之上。纸上书写、演算、画图，这个过程本身就是思维的外化。

　　第二，孩子每天放学回家，最核心、最固定的学习场景就是“在书桌前写作业”。与此同时，家长最大的痛点、最重的辅导压力，也正是在这个场景下爆发的。学而思学习机所要破解的，正是这个高频、刚需且焦虑的难题。

　　由此，学而思学习机AI老师的核心设计思路是：不改变孩子的纸质学习习惯，而是让AI主动、无感地融入其中。李通说：“我们希望当孩子在纸面上学习时，AI老师能自然介入，成为他身边那个‘看得见’的学习伙伴。”

　　李通解释：“我们小思AI的长期目标不是成为一个简单的答题工具，而是取代家庭场景中书桌旁的真人辅导角色，最终实现让家长放心的、高质量的个性化学习‘托管’。”

　　如果以终为始的倒推，要实现“家庭托管”这一愿景，就必须回答一个关键问题：“家长是不是很放心的，把自己的孩子交给这个学习机，然后让他有意义的高效率的度过比如说1到2个小时的时间?”

　　学而思小思AI的产品逻辑非常清晰：一旦将主场景聚焦在“家庭中的书桌前”，那么主要的交互方式就指向了“纸屏互动”。

　　02 为什么“纸屏互动”是人机交互新范式?

　　要理解纸屏互动的革命性，必须明确学而思对“AI老师”的定义。可以说，小思AI不是一个答题工具，而是一个教育智能体。

　　李通系统地解释了学而思心中“好的AI老师”所应具备的三重能力：

　　“第一是本身的业务能力，比如说批改、讲题，然后诊断规划，包括口语对答，这些都属于AI老师本身的一些业务能力的范围。

　　第二是对于孩子的理解，即掌握孩子的一些学习情况，这非常重要，这是我们做个性化教育的基础。

　　第三是交互能力，这也很关键。它需要能看，能听，如听到孩子一些语音指令。”

　　这意味着“纸屏互动”成为了一个真正的AI老师，它将这三个维度融合在一起。

　　与普通学习机相比，学而思学习机纸屏互动的突破在于实现了“步骤级陪伴”。这意味着孩子每在纸上写下一个步骤，学习机就能实时识别内容、即时批改对错，并动态调整接下来的讲解策略。

　　李通总结：“纸屏互动是完全以孩子作为中心的，基于孩子的这个学习情况来去自适应的调整。”

　　这种能力解决了孩子在家自学的辅导困境。例如，当孩子某一步骤写错，AI不会直接给出答案，而是引导他思考错在哪里;如果孩子表示“没听懂”，AI还会自动切换另一种讲法，真正做到“因步施教”。

　　在这个过程中，AI老师能看到孩子在纸质上作答，也能听到孩子直接的语音回复，形成一种多模态的、自然的交互闭环。

　　这使得AI老师的价值评判标准发生了改变：其价值不在于屏幕里的演示多么酷炫，而在于它对现实世界中孩子行为的理解和反馈能力。

　　这正是AI老师从L2(助手级)迈向L3(教师级)最关键的一步。

　　更重要的是，在这背后，小思AI构建了一个完整的教学闭环：系统基于学生的作答情况，融合了批改模型、讲题模型和推荐模型，先通过批改模型精准诊断问题，再由讲题模型针对性精讲，最后通过推荐模型智能推送相似题进行巩固。在学而思看来，对一位真正的AI老师而言，这三项能力相辅相成，缺一不可。

　　如果说以前的学习机解决的是“有什么内容”的问题，如有多少精品课程，那么学而思学习机机小思AI 通过纸屏互动，解决的是“如何学习这些内容”的过程问题。

　　就像李通所说的：“学习机的第一个阶段，大家拼的是‘好内容+好屏幕’，而现在竞争的核心已经转向AI。”

　　学习机从此不再是一个被动的资源库，而是一个能主动介入学习过程的伙伴。

　　03 曾席卷全行业的Demo，被学而思学习机做出来了

　　教育科技行业也有纸屏互动的想法，但在学而思学习机之前，没有成熟的产品落地。

　　早在2024年5月，OpenAI邀请可汗学院创始人萨尔曼·可汗及其儿子共同参与GPT-4o的测试，重点评估GPT-4o在数学辅导能力。‌

　　在测试中，萨尔曼·可汗的儿子在纸上做了一道几何题，然后手机摄像头打开，GPT-4o来根据他的作答情况实时地给他讲解。

　　但当时这只是一个Demo，到目前也没有进行产品化。

　　这个Demo证明了技术方向的可行性，但将其打造成一个稳定、可靠、可量产的产品，却是一条艰难的道路。

　　李通表示：“我们在目前实现的纸屏互动能力确实是行业唯一的。”

　　伊丽君介绍，“小思”AI自2023年11月诞生以来，经历了快速迭代。1.0版本实现了从0到1的跨越，建立了智能交互基础;2024年5月的2.0版本基于大模型Agent技术，构建了智能理解与决策能力，并配备了记忆系统和情感系统。

　　而3.0版本的突破，则建立在两大技术成熟的基础之上：

　　第一，多模态感知系统的成熟。

　　统能够同时处理视觉、语音、文本等多维度输入，实现真正的全场景感知。特别是在纸屏互动方面，书写识别准确率大幅提升，即便是潦草的笔迹或复杂的数学公式，也能精准识别。

　　第二，教育大模型的持续深化。

　　小思AI 3.0搭载的九章大模型在教育领域进行了专门优化。李通指出：“在业务能力上，如高频刚需的功能，像批改、讲题等，在准确性上是我们内部在做这个九章大模型的核心的指标。”

　　通过在海量教育数据上做持续的预训练与强化学习，模型不仅在解题正确率上达到新高，更重要的是在“讲题质量”这一主观维度上实现了显著提升，能够根据学生的学段、知识掌握程度自动选择最适合的讲解方法。

　　尽管最终呈现给用户的交互形式看起来流畅自然，但实现过程却充满了挑战。

　　这背后包括要去识别孩子各式各样的笔迹，然后批改，然后讲题等，涉及到诸多细节。李通坦言：“我们看到的一轮简单交互，背后串联了非常多算法能力。它特别容易出现bad case。”

　　04 长期目标是做 “孩子书桌旁的机器人”

　　现在，小思AI有了L3(教师级)的雏形，未来还有很多迭代空间。

　　目前，学而思AI老师的“纸屏互动”已在数学等学科中实现应用，未来还将拓展至更多的科目。

　　未来，AI老师将不再仅仅“看懂”题目和“听懂”指令，它将能像真人老师一样，感知到更丰富的环境信息与学生的状态，甚至是能够基于全局学习数据生成动态的、长期的学习路径规划，甚至堪比“AI张雪峰”。

　　李通透露，学而思团队的长期目标是将学习机打造成“孩子书桌旁的机器人”，不仅看懂纸面内容，还能感知孩子的坐姿、表情、专注度，甚至情绪状态，从而提供更人性化的学习陪伴。

　　“理想情况下，AI老师应该像真人老师一样，在孩子烦躁时给予鼓励，走神时及时提醒。” 李通说，“而这，正是我们持续努力的方向。”

　　从L3到L4，意味着AI老师需要从在特定场景下提供闭环解决方案，进化到更全面、更拟人、更深度个性化的陪伴，学而思已经在路上。

商学院

Open Talk

学而思学习机推出“纸屏互动”：桌面机器人AI老师，上岗

相关阅读