“大模型是教育未来发展的最大变量。”

深度|对话猿力科技CTO杨元祖:大模型为教育解决方案带来“第三种可能”

2024-05-21 10:35:39发布     来源:多知    作者:王上  

  来源|多知

  作者|王上

  “大模型对我们来讲是‘技术’,不是‘产品’,它应该在产品中发挥价值。”猿力科技联合创始人、CTO杨元祖在与多知对话时反复如是强调。

  2023年11月,猿力科技自研大模型落地教育应用“海豚AI学”,其中,小学数学练习解析环节的“小白老师”苏格拉底式答疑陆续开启公测,这款产品被猿力科技视为“新一代智能学习产品”——这个分量并不轻。

  猿力科技于2014年成立了AI Lab,旗下产品猿题库、小猿口算及小猿搜题等都是以AI Lab为基底发展而来。近日,北京猿力科技有限公司“看云”生成式人工智能备案成功。猿力科技正全面拥抱生成式AI,大模型正进入到各个业务/产品线、各个环节,但它并不明显,而是隐藏在产品的交互背后。从产品角度来看,大模型可能体现在某个功能、某个场景、某个环节,甚至是服务的过程中。

  对于大模型的应用,杨元祖提到,“从AI原生角度去出发去打造一个产品,就像拿个锤子去找钉子,不一定是靠谱的。猿力科技的做法一直是从用户场景出发,看自己的‘工具集’如何去满足用户。”这种思考方式更像是“让钉子去找锤子”。

  在杨元祖看来,做大模型应用,最困难的是找到一个对用户有价值且大模型可以实现的场景。为此,猿力科技还组建了一个“预研团队”,这是猿力科技落地大模型应用的一个探路先锋队。

  人工智能的进展,从电影剧情照进了现实。体现在企业日常经营、产品迭代中,更多是涓涓细流式的探索与积累。

  杨元祖认为,猿力科技这些年的发展节点不是“做出一个产品”,而是“做出一个决策”。大模型就是这样的一个关键决策,但它并非灵光一现的结果,而是经过长期关注、来回认知、不断验证的过程。

  他说,大模型是教育解决方案接下来改进的最大变量。假设没有大模型,猿力科技也会一直迭代产品,但这是相对渐进的过程。而大模型这个变量给了猿力科技一次重塑教育产品的机会。

  杨元祖认为,做完多模态大模型的拼图就完整了,多模态对教育领域的重要性远超其他领域,猿力科技对多模态的期待和投入非常大。

  这次对话反映了一家头部教育科技公司探索大模型之于教育改革的真实状态,其中“做出决策”至关重要,而产品则是决策的结果,创新往往孕育于日常耕耘之中。

  以下为访谈内容(经多知编辑):

  01

  大模型“上限很高,成本可控”,教育领域会有无限的应用场景

  多知:猿力科技是什么时候决定要做大模型的?

  杨元祖:它可能不是一个准确的时间节点,大模型这件事情并不是ChatGPT发布那一刻我们灵光一现,然后下重注,并不是。

  预训练、GPT很早就有,我们很早便在关注Transformer的架构对于教育的影响,一开始我们发现大模型渲染成本特别高,但它的效果可能还比不上我们原有自研的一些模型,所以是一直保持关注的过程。

  来来回回,有过反复,甚至有过怀疑。最初大家对于大模型背后技术的预见还比较模糊,没有认为这就是将来的希望。全世界就OpenAI一家是在2017年 Transformer 架构论文发布时就笃定这是未来,且下了重注。

  在ChatGPT发布之后,我们逐步地去挖掘它能被用来做什么,也越来越感觉到它令人震撼。但也没有认为应该马上去自研大模型。

  首先这东西要怎么应用,大家并不知道。没有人能在第一时间判断它一定能用到我们的应用当中去,所以开端没有那么戏剧化。这是一个慢慢理解的过程,慢慢有更多的信息摄入,包括各种观点争鸣。

  GPT-4的发布是一个完全不同的节点,因为它跟之前的GPT-3.5是有质的差异,这个事情带来的变化比想象的要大得多。所以这时候我们才会考虑要自研一个大模型。

  多知:最后为什么做出了自研大模型的决策?

  杨元祖:最初大家面临的问题是大模型成本非常非常高,可能数亿美元。所以就会面临一个决策,“大模型是值得我们公司去投入的吗?还是它就应该是微软、Google,国内像百度、阿里、腾讯这样的公司去投入的?”这是需要回答的问题。

  随着接触的信息越来越多,我们发现其实成本没有那么夸张。我们计算到底需要多少数据量,需要多少运算量,需要多少钱,最终算出来后才明白大家把这个事情神化了,其实并不需要特别夸张的资金投入。它就是一个慢慢地不断来回反复的过程。

  但是最终决策肯定不能够等到(大模型的一切都)完全清晰,那就太晚了。整体上粗略计算要花多少钱,我们觉得是可接受的,所以就开始做了。可以说,它的上限无限高,下限就是这个成本。

  多知:成本大致是怎样的?

  杨元祖:我们大概有几百台机器,资金投入是动态变化的。总之,上限很高,成本可控。我们当时的判断是大模型会给教育带来巨大的不同,这是一个最直接的判断。

  然后准备团队,购买机器。到底怎样产品化,这是后续的工作。

  多知:团队希望看云大模型主要解决哪些问题?

  杨元祖大模型能力还是希望它更通用,只是说我们的大模型能更加符合教育领域,比如说更会做题,更擅长以一个老师的方式来掌握知识点。也就是说通用的大模型可能对于语言的理解能力是很强的,但它对语言的理解能力是一个普通人的理解能力,它不是一个语文老师的理解能力。普通人和语文老师看待同一句话、同一句语言的视角不一样,这是两者的差异。

  比如我们要训练的“辨识”这一类的能力,要比通用大模型要好。它可能用在哪呢?比如作文批改。

  接下来还有更多应用场景,这就是大模型吸引人的地方,它有无限的应用场景。我们希望它把教育的能力学会了之后,能重塑更多的教育场景。

  多知:海豚AI学背后应用了哪些技术?

  杨元祖:我们认为AI技术都应该是为我们所用的,而不是特别强调采用的是哪一种技术。比如RAG (搜索增强)、检索增强或者预训练,这些我们都会用。不管叫“垂直大模型”还是叫“教育大模型”,只要它叫“大模型”,就具备一定的通用能力,这是它最大的特点。区别只是我们自己训练的大模型在通用能力上或许无法达到全球顶尖水平。

  但是我们在教育方面的能力上能够达到甚至超过GPT-4,然后在教育相关的具体任务上,比通用大模型好,同时,我们的通用能力能够达到过关的水平,这是我们的目标。

  假设我们一开始就想要做一个比GPT-4通用能力还要好的大模型,我觉得大概率是做不出来的,这不是我们这样的公司应该去投入的地方。