商汤元萝卜机器人的研发逻辑：“AI是效率、质量、成本的最好结合”

2023-09-19 09:53:09发布来源：多知网作者：杜轩

　　来源|多知网

　　整理|徐晶晶

　　摄|张蔚斐

　　2016、2017年，谷歌旗下DeepMind公司开发的Alpha Go先后战胜李世石、柯洁等人类冠军，“人机大战”引发世界轰动。而第一款家庭端围棋机器人——商汤元萝卜围棋机器人却要到七年后才正式面世。

　　在多知第42期OpenTalk活动现场，商汤科技创新工程院教学产品负责人杜轩解析了棋类机器人必备的三要素：人工智能是对人类行为的模拟，机器人要模拟人类感知世界进行思考，对外界做出反馈。如果类比成人类下棋的动作，Alpha Go的出现可以视作在算力算法层面率先实现突破，相当于下棋机器人有了大脑;机器人下棋也需要眼睛，这就需要依靠视觉识别技术，辨别不同光线下棋子位置;第三，机器人下棋取子落子还需要手臂，高精度且高安全性的家用级机械臂技术的出现，使得机器人的出现成为了可能。

　　(商汤科技创新工程院教学产品负责人杜轩)

　　正如商汤科技董事长兼CEO徐立在发布会中提到的：“从超大的数据中心到小巧的家用机器人，‘元萝卜’的背后源于算力的巨大进步、极高的手眼协同精度和强大的工程创新成果。”

　　在此三要素上，兼顾成本控制，下棋机器人才能更好地为C端市场所接受。在杜轩看来，“AI是效率、质量、成本的最好结合。”

　　那么，以To B业务起家商汤为什么要以围棋机器人为切口，作为其第一款To C家庭端产品?

　　“之所以会选择机器人这种形式，是因为它是AI技术非常重要的载体。与AI技术发展的大趋势也是相呼应，都是从感知到决策再到行动。”此前，商汤创新工程院院长、集团副总裁沈徽曾在元萝卜发布会上表示。

　　杜轩更进一步透露了商汤研发棋类机器人的思考：“我们想让作为新技术的AI走进千家万户，而将新技术与中国传统文化相结合是一个思路，象棋、围棋都是中国传统文化的典型代表，也是一个垂直细分的大市场。”

　　2022年8月、2023年6月，商汤先后上线元萝卜象棋版、围棋版机器人。其中，元萝卜围棋版定位为陪练产品，“把机器人做难(高级别对弈)很容易，但是做到跟孩子的能力匹配(降级)是一个很难的过程。”在教育属性之外，元萝卜还具备家庭休闲、娱乐属性。

　　这两款Q萌的机器人显然受到了市场的欢迎。在2023年上半年业绩报告中，商汤透露，元萝卜单月销量迅速破千台，居天猫、京东双平台机器人品类交易排行榜第一。

　　在家庭端产品之外，杜轩还透露元萝卜走进围棋课堂的最新思考——面向机构和公立校推出围棋智能教室，帮助老师提高教学效率。

　　以下为杜轩分享原文，经多知编辑整理：

　　大家好，我是杜轩。希望跟大家一起探讨人工智能能如何对棋类和其他的教育类产品产生更多的帮助。

　　先介绍一下商汤科技的基本情况。商汤科技是一家业内领先的人工智能公司，拥有超过百亿AI基础建设投入，超过1万个专利，超过5000名员工，前段时间也推出了大模型。我们在很多领域也取得了很多成绩，包括在自研深度学习框架、AR和识别与自动机器学习这些方面都取得很大的收获。

　　从To B延展到To C场景，元萝卜是怎样诞生的?

　　可以看到，以往商汤做了这么多事情，核心聚焦的是从科技领域切入服务B端、G端，那么，要想让AI进入家庭，商汤要想进入To C的家庭端市场，可以提供什么样的产品呢?

　　我们的思考是，AI是最新的技术，我们希望把最新的技术与中国的传统文化相结合，比如象棋、围棋都是中国传统文化的精华，这两个方向到底该怎么结合？我们先思考自身的优势：

　　其一，商汤拥有家用级机械臂技术。以往，机械臂主要应用场景是在工业领域，也很贵，也很笨重。商汤可以说是第一家把机械臂做到家庭领域的公司。机械臂是非常精密的技术，要进入家庭，需要在缩小体积的同时提升更高的精准度，这需要突破很多技术难点，包括如何做到精准将每一颗棋子精准落到棋盘格上。

　　其二是成本控制。进到家庭场景的消费级产品，其制作成本一定要降下来，才能普惠大众，让AI更好地服务大众，让更多家庭接触、喜欢上象棋、围棋这样的国学文化。

　　第三是安全性。小朋友在和小元萝卜下棋的过程中会进行高频互动，难免有所碰触。为了确保家庭场景中机械臂足够安全、不会对小朋友造成伤害，我们经过多次研发和尝试，最终做到机械臂在正常摆动不影响下棋效率的前提下做到接触力最小，上市之初我们也对一些易碎产品进行了测试，均在机械臂的碰撞下不会产生破坏。

　　因此，商汤从2020年开始研发元萝卜，直到2022年才正式发布元萝卜机器人。

　　人工智能分两方面，一方面是硬件部分，另一方面是软件部分。刚刚提到的机械臂是硬件部分，它相当于真人落子的手臂。在软件层面，我们也需要做很多：

　　首先，图像识别方面，利用全栈视觉算法精准识别。人工智能是对人类很多行为的模拟，要模拟我们人类感知世界去思考，对外界做出一个反馈的机制。所以第一步肯定要有视觉识别，它通过对不同光线下对棋子位置的识别，判断要下一步落子。可以将全栈视觉算法简单理解为机器人的眼睛。

　　第二，语义分析方面，元萝卜要从棋盘上分析出棋子的位置，通过对棋盘建模进行位置判断。这就相当于是大脑，对弈的过程中，它不仅要能看到棋子、精准抓取棋子，它还要思考怎么跟人下才能获胜。

　　从最初入门级别到最高的职业级别，我们根据每个级别的棋力都做了一个相对应的算法匹配。对于级别匹配，其实做到难(高级别)很容易，但是做简单级别比做难级别(降级)要更难。比如一个小朋友刚学习下围棋不久，下得不是很好，可能犯一些错误，机器人跟他下，怎么让小朋友觉得自己跟机器人是一个水平的，有胜有负，这样才不会打击小朋友的自信心，这个其实很难。

　　此外还要结合机器算法和仿真模拟算法，确保机器人对环境的认知，能更快适应这个物理世界，通过算法可提高效率降低成本。

　　基于以上，我们把元萝卜象棋机器人、围棋机器人先后生产出来了。当然，围棋机器人的取子结构比象棋更复杂，它的机械臂精度要更复杂。

　　有了硬件和软件的技术加持，诞生了这两款可爱的元萝卜产品，它们能做什么呢?

　　首先，我们跟中国象棋协会合作，做了象棋的教学与考级。

　　这是一款在家庭中能够帮助孩子做教学的机器人。它有机械臂、屏幕和语音，可以模拟真人教学讲课，也能把教和练结合在一起，在棋盘上摆棋子。教完之后，元萝卜可以让孩子尝试一下这个棋可以怎么走，孩子走对则给予鼓励，走错的话则教孩子怎么走。

　　在教和练之外，我们跟象棋协会合作做了在线考级，这是象棋领域第一款在线考级的产品，全国首个由官方授权的在线象棋考级机器人，也是我们弘扬中国文化的一次尝试。

　　其次，元萝卜提供做题和复盘功能。

　　其实市面上有很多软件产品上也都可以帮孩子做题，但是做题的关键点不是判断做对与否，而是当他做对了告诉他为什么是对的，当他做错了分析哪是错的。我们特意做了一些工作和努力，帮助孩子去理解。

　　比如以往当孩子围棋做题的时候，如果做错了，很多软件就是让孩子重新试一遍。元萝卜不是这样的逻辑，而是告诉孩子：“你做错了，我可以跟你继续下，告诉你哪错了。”在一些常见错误下，元萝卜会告诉你，你这个错误为什么产生。

　　第三就是非常重要的陪练功能。

　　刚才提到，把机器人做难（高级别对弈）很容易，但是做到跟孩子的能力匹配（降级）是一个很难的过程。我们通过不断细化级别，让机器学习这个阶段孩子常犯的错误，让他们更有人的属性。

　　考虑到孩子们也喜欢跟真人对奕，我们也对接了一些线上对弈平台(包括99围棋、新博少儿、弈客和佳弈等)，可以通过元萝卜实现远程真人对弈。这样对孩子的视力健康也有帮助。

　　除了有教育属性之外，它还有一个非常重要的属性即家庭休闲、娱乐属性。全家人可以一起帮下棋的孩子支招;元萝卜还有语音对话功能，问它一些简单的问题都可以。

　　Q萌的元萝卜面世后，自然很受孩子们的欢迎。去年机器人大会上，元萝卜被围得里三层、外三层，家长、孩子都非常感兴趣。

　　元萝卜的更多可能：“围棋智能教室”走进课堂

　　其实在元萝卜研发之初我们就在思考，除了可以在家庭生活中可以帮助孩子学习围棋、象棋，元萝卜是否可以走入教室辅助老师更好教学，让学生在课堂中有更深刻、更有趣的体验?因此，未来我们也在畅想和探讨一个全新的方向——让元萝卜走进课堂。

　　大家都知道传统围棋教室是讲台上有一个立着的大棋盘，老师用它来教学演示，孩子用的是小棋盘。但是老师并不能时时观察到每个孩子的动向。

　　我们畅想未来的智能教室老师用一套智能教学系统，可以直接在其中讲课，也可以跟孩子做互动。

　　教师端有一个设备，既可以用于教学，也可以同步看到学生的对弈情况，还可以给学生下发任务，也可以把学生做题过程拿出来做复盘讲解。每个孩子面前有一台元萝卜设备，可以接收任务，可以跟设备进行交互，完成练习过程。

　　举个例子来说，老师想让孩子做一道围棋题会是什么流程?

　　在传统教室里，老师讲完课之后，会在大棋盘上把题做出来，下一步孩子需要解这道题的话，孩子执黑或者执白，要把两方情况都想到，孩子如果想对则是非常顺利的情况，但如果想错的话，老师会看孩子完成情况，把错误之处记录下来，然后在棋盘上摆出来。

　　但是在智能教室里，老师讲完课之后直接通过一体机把题目发到孩子那边的机器上，每个孩子会看到这道题目，由机器摆好棋盘。老师发令后孩子可以直接做题。做题过程中老师可以实时看到每个孩子的情况，打开这个挂屏也可以做讲解。

　　可以看到，智能教室相对于传统围棋教学会有一些优势，首先会拉近老师和学生的距离，让我们之间不再是老师是老师，学生是学生的状态。老师可以在上面查看学生练习对弈的情况;同时也有记录可以轻松复盘，老师很自由，如果看见存在的问题也不用立马打断，孩子先做，最后再调出来讲解。同时我们能够把整个教学过程中，孩子们遇到所有问题全部记录下来，不管老师还是家长，后面对这些问题都会做包括复盘、了解、记录，知道孩子什么地方有问题，后面可以去提高。

　　对于公立校来说，现在围棋协会、象棋协会都在推围棋、象棋进学校，但很多学校开展不了是受限于围棋老师的资源不足，因为这是比较专业的领域，学校可能没有专业的围棋、象棋老师。

　　针对这种情况，元萝卜则提供了可能性，采用双师模式，公立校老师可以先播放教学视频，让孩子看知识点。后面可以用元萝卜练习，帮助孩子们完成学习跟进。

　　这是元萝卜目前在To B方向的尝试。

　　AI是一个非常大的领域，我们只是在元萝卜上做了第一步。畅想一下后面可以做什么?我们可以把孩子学习记录，学情、诊断全部记录下来，让AI帮助孩子、帮助家长、老师定位孩子的问题，帮他做个性化方案，以及在过程中不断跟进，调整，让孩子按节奏去学习。

　　在传统教育里大家都想做这件事情，但是受限于效率、质量、成本。这就是AI的优势，AI有大量算力和数据记录可以确保这个事情完成。AI是效率、质量、成本的最好结合。

　　今天就分享到这儿，非常感谢大家。

　　(现场观众体验元萝卜围棋机器人)

　　在演讲后的Q&A互动环节，对于观众提问的元萝卜是否会推出国际象棋版本，杜轩表示，尽管象棋、围棋已经有元萝卜机器人了，但国际象棋依然需要具体问题具体分析。国际象棋的棋子是立体棋子，不同于其它棋类棋子，他认为，国际象棋取子这个事情本身不复杂，但真正的挑战在于，基于现有的产品框架上，受限于家庭空间，这类产品的体积不能太大。团队内部也在探讨国际象棋机器人的市场需求和成本实现之间的可能性。

　　有观众提问，元萝卜围棋版目前主要聚焦的是陪练场景，以后是否会发展成为教练?对此，杜轩分析了象棋、围棋两款产品不同的市场：“象棋是大家有基础，很少有人报班学;会围棋的人没象棋那么多，但会的人基本都要报班学习。所以围棋大家如果想往更专业方向走，会更多通过学校的方式来实现，象棋则是普及为主。”

商学院

Open Talk

商汤元萝卜机器人的研发逻辑：“AI是效率、质量、成本的最好结合”

相关阅读