“AI是一个非常大的领域,我们只是在元萝卜上做了第一步。”

商汤元萝卜机器人的研发逻辑:“AI是效率、质量、成本的最好结合”

2023-09-19 09:53:09发布     来源:多知网    作者:杜轩  

  来源|多知网

  整理|徐晶晶

  摄|张蔚斐

  2016、2017年,谷歌旗下DeepMind公司开发的Alpha Go先后战胜李世石、柯洁等人类冠军,“人机大战”引发世界轰动。而第一款家庭端围棋机器人——商汤元萝卜围棋机器人却要到七年后才正式面世。

  在多知第42期OpenTalk活动现场,商汤科技创新工程院教学产品负责人杜轩解析了棋类机器人必备的三要素:人工智能是对人类行为的模拟,机器人要模拟人类感知世界进行思考,对外界做出反馈。如果类比成人类下棋的动作,Alpha Go的出现可以视作在算力算法层面率先实现突破,相当于下棋机器人有了大脑;机器人下棋也需要眼睛,这就需要依靠视觉识别技术,辨别不同光线下棋子位置;第三,机器人下棋取子落子还需要手臂,高精度且高安全性的家用级机械臂技术的出现,使得机器人的出现成为了可能。

  

  (商汤科技创新工程院教学产品负责人杜轩)

  正如商汤科技董事长兼CEO徐立在发布会中提到的:“从超大的数据中心到小巧的家用机器人,‘元萝卜’的背后源于算力的巨大进步、极高的手眼协同精度和强大的工程创新成果。”

  在此三要素上,兼顾成本控制,下棋机器人才能更好地为C端市场所接受。在杜轩看来,“AI是效率、质量、成本的最好结合。”

  那么,以To B业务起家商汤为什么要以围棋机器人为切口,作为其第一款To C家庭端产品?

  “之所以会选择机器人这种形式,是因为它是AI技术非常重要的载体。与AI技术发展的大趋势也是相呼应,都是从感知到决策再到行动。”此前,商汤创新工程院院长、集团副总裁沈徽曾在元萝卜发布会上表示。

  杜轩更进一步透露了商汤研发棋类机器人的思考:“我们想让作为新技术的AI走进千家万户,而将新技术与中国传统文化相结合是一个思路,象棋、围棋都是中国传统文化的典型代表,也是一个垂直细分的大市场。”

  2022年8月、2023年6月,商汤先后上线元萝卜象棋版、围棋版机器人。其中,元萝卜围棋版定位为陪练产品,“把机器人做难(高级别对弈)很容易,但是做到跟孩子的能力匹配(降级)是一个很难的过程。”在教育属性之外,元萝卜还具备家庭休闲、娱乐属性。

  这两款Q萌的机器人显然受到了市场的欢迎。在2023年上半年业绩报告中,商汤透露,元萝卜单月销量迅速破千台,居天猫、京东双平台机器人品类交易排行榜第一。

  在家庭端产品之外,杜轩还透露元萝卜走进围棋课堂的最新思考——面向机构和公立校推出围棋智能教室,帮助老师提高教学效率。

  以下为杜轩分享原文,经多知编辑整理:

  大家好,我是杜轩。希望跟大家一起探讨人工智能能如何对棋类和其他的教育类产品产生更多的帮助。

  先介绍一下商汤科技的基本情况。商汤科技是一家业内领先的人工智能公司,拥有超过百亿AI基础建设投入,超过1万个专利,超过5000名员工,前段时间也推出了大模型。我们在很多领域也取得了很多成绩,包括在自研深度学习框架、AR和识别与自动机器学习这些方面都取得很大的收获。

  01

  从To B延展到To C场景,元萝卜是怎样诞生的?

  可以看到,以往商汤做了这么多事情,核心聚焦的是从科技领域切入服务B端、G端,那么,要想让AI进入家庭,商汤要想进入To C的家庭端市场,可以提供什么样的产品呢?

  我们的思考是,AI是最新的技术,我们希望把最新的技术与中国的传统文化相结合,比如象棋、围棋都是中国传统文化的精华,这两个方向到底该怎么结合?我们先思考自身的优势:

  其一,商汤拥有家用级机械臂技术。以往,机械臂主要应用场景是在工业领域,也很贵,也很笨重。商汤可以说是第一家把机械臂做到家庭领域的公司。机械臂是非常精密的技术,要进入家庭,需要在缩小体积的同时提升更高的精准度,这需要突破很多技术难点,包括如何做到精准将每一颗棋子精准落到棋盘格上。

  其二是成本控制。进到家庭场景的消费级产品,其制作成本一定要降下来,才能普惠大众,让AI更好地服务大众,让更多家庭接触、喜欢上象棋、围棋这样的国学文化。

  第三是安全性。小朋友在和小元萝卜下棋的过程中会进行高频互动,难免有所碰触。为了确保家庭场景中机械臂足够安全、不会对小朋友造成伤害,我们经过多次研发和尝试,最终做到机械臂在正常摆动不影响下棋效率的前提下做到接触力最小,上市之初我们也对一些易碎产品进行了测试,均在机械臂的碰撞下不会产生破坏。

  因此,商汤从2020年开始研发元萝卜,直到2022年才正式发布元萝卜机器人。

  人工智能分两方面,一方面是硬件部分,另一方面是软件部分。刚刚提到的机械臂是硬件部分,它相当于真人落子的手臂。在软件层面,我们也需要做很多:

  首先,图像识别方面,利用全栈视觉算法精准识别。人工智能是对人类很多行为的模拟,要模拟我们人类感知世界去思考,对外界做出一个反馈的机制。所以第一步肯定要有视觉识别,它通过对不同光线下对棋子位置的识别,判断要下一步落子。可以将全栈视觉算法简单理解为机器人的眼睛。

  第二,语义分析方面,元萝卜要从棋盘上分析出棋子的位置,通过对棋盘建模进行位置判断。这就相当于是大脑,对弈的过程中,它不仅要能看到棋子、精准抓取棋子,它还要思考怎么跟人下才能获胜。

  从最初入门级别到最高的职业级别,我们根据每个级别的棋力都做了一个相对应的算法匹配。对于级别匹配,其实做到难(高级别)很容易,但是做简单级别比做难级别(降级)要更难。比如一个小朋友刚学习下围棋不久,下得不是很好,可能犯一些错误,机器人跟他下,怎么让小朋友觉得自己跟机器人是一个水平的,有胜有负,这样才不会打击小朋友的自信心,这个其实很难。

  此外还要结合机器算法和仿真模拟算法,确保机器人对环境的认知,能更快适应这个物理世界,通过算法可提高效率降低成本。

  基于以上,我们把元萝卜象棋机器人、围棋机器人先后生产出来了。当然,围棋机器人的取子结构比象棋更复杂,它的机械臂精度要更复杂。

  有了硬件和软件的技术加持,诞生了这两款可爱的元萝卜产品,它们能做什么呢?

  首先,我们跟中国象棋协会合作,做了象棋的教学与考级。

  这是一款在家庭中能够帮助孩子做教学的机器人。它有机械臂、屏幕和语音,可以模拟真人教学讲课,也能把教和练结合在一起,在棋盘上摆棋子。教完之后,元萝卜可以让孩子尝试一下这个棋可以怎么走,孩子走对则给予鼓励,走错的话则教孩子怎么走。

  在教和练之外,我们跟象棋协会合作做了在线考级,这是象棋领域第一款在线考级的产品,全国首个由官方授权的在线象棋考级机器人,也是我们弘扬中国文化的一次尝试。

  其次,元萝卜提供做题和复盘功能。

  其实市面上有很多软件产品上也都可以帮孩子做题,但是做题的关键点不是判断做对与否,而是当他做对了告诉他为什么是对的,当他做错了分析哪是错的。我们特意做了一些工作和努力,帮助孩子去理解。

  比如以往当孩子围棋做题的时候,如果做错了,很多软件就是让孩子重新试一遍。元萝卜不是这样的逻辑,而是告诉孩子:“你做错了,我可以跟你继续下,告诉你哪错了。”在一些常见错误下,元萝卜会告诉你,你这个错误为什么产生。

  第三就是非常重要的陪练功能。

  刚才提到,把机器人做难(高级别对弈)很容易,但是做到跟孩子的能力匹配(降级)是一个很难的过程。我们通过不断细化级别,让机器学习这个阶段孩子常犯的错误,让他们更有人的属性。

  考虑到孩子们也喜欢跟真人对奕,我们也对接了一些线上对弈平台(包括99围棋、新博少儿、弈客和佳弈等),可以通过元萝卜实现远程真人对弈。这样对孩子的视力健康也有帮助。

  除了有教育属性之外,它还有一个非常重要的属性即家庭休闲、娱乐属性。全家人可以一起帮下棋的孩子支招;元萝卜还有语音对话功能,问它一些简单的问题都可以。

  Q萌的元萝卜面世后,自然很受孩子们的欢迎。去年机器人大会上,元萝卜被围得里三层、外三层,家长、孩子都非常感兴趣。