ChatGPT的迷人之处在于,它使得OpenAI变成消费AI产品的领衔者。

对话好未来AI团队负责人:刷屏全网的Chat GPT可以和教育擦出什么火花?

2022-12-13 12:13:02发布     来源:多知网    作者:多知网  

  来源|多知网

  作者|多知网

  图片来源|Pexels

  11月30日, OpenAI发布了“网红AI”对话模型ChatGPT。在过去的两周,席卷了整个互联网科技圈。

  起因是美国人工智能公司OpenAI发布免费机器人对话模型ChatGPT(GPT-3.5系列),模型中首次采用RLHF(从人类反馈中强化学习)方式。模型目前处于测试阶段,用户与ChatGPT之间的对话互动包括普通聊天、信息咨询、撰写诗词作文、修改代码等。

  ChatGPT功能看起来非常全面,被称作“最强AI(人工智能)”,面世5天已有超过100万用户注册。

  ChatGPT到底是怎么回事?ChatGPT的很多功能看似可以跟教育领域结合,未来是否可以落地呢?对此,多知网对话了好未来AI团队负责人。

  以下为对话实录:

  多知网:ChatGPT的出现是否是AI技术一个质的突破?

  好未来AI团队负责人:ChatGPT主要有两个亮点:

  1)ChatGPT跟它的诸多前辈相比,针对用户的提问已经可以做出让人眼前一亮的回答,其中的部分回答是能够实质性地帮到用户。

  比如,为打工人生成一份体面的周报;为程序员的代码定位bug,并给出修复建议等。

  2)ChatGPT的另一个亮点是它可以和用户进行多轮对话,对话过程非常丝滑,这也是现有的聊天机器人做不到的。

  与其他的使用大数据量训练出来的大语言模型一样,ChatGPT同样也是经过先预训练,后微调的过程训练得到的对话模型。模型的训练采用强化学习 RLHF(从人类反馈中强化学习)方式进行训练,但是OpenAI这次在数据收集策略上与以往的大模型不同。RLHF的学习方式类似于Google search的人工反馈迭代机制,但是显然这种更新方式长远看更加直接有效。

  首先,采用有监督学习训练得到一个初始模型。人类、AI培训员分别作为用户和AI,模拟人类和AI之间的对话。

  此外,还创建了一个reward模型,将机器生成的回复由人类培训员进行筛选,按照质量排序,挑出质量最优的那个。

  多知网:如何看待有关ChatGPT的讨论?它目前有哪些想象空间和不足?

  好未来AI团队负责人: ChatGPT的问世,让AIGC(AI-generated content,即AI生产内容))再次火爆。仅5天时间,ChatGPT就有100多万用户注册。这些用户纷纷在社交网络等媒体上晒出"调戏"聊天机器人的互动,这已经成为了互联网日常更新的热梗,他们用它来写“小学生”风格的作文、问奇怪的问题,这是在疯狂探索它的功能“边界”。

  但作为底层模型的GPT-3,其实已经诞生两年了,基于GPT-3的初创公司Jasper新获得1.25亿美元的融资,估值达到15亿美元。与之不同的是,ChatGPT既免费,又好用。AIGC的革命早已掀起,当AI生成的艺术变得简单、免费时,人类对此的兴趣和意识也就出现了爆炸式的增长。

  ChatGPT是免费的,这很关键。ChatGPT的迷人之处在于,它使得OpenAI变成消费AI产品的领衔者。另外,英语学习平台「Speak」获OpenAI领投2700万美元B轮融资,为对话式口语练习提供了新的想象空间。

  关于ChatGPT的一些想象空间:

  ChatGPT的出现,基本宣布了人工智能的对话模型开始在大范围、细粒度问题上给出普遍稳妥的答案,简单地说,人工智能的大对话模型可以达到基本不犯错误的水平了。

  现在,研究人员每天都在以飞速的方式向全世界提供着大量新功能,而企业和产品人员才刚刚开始消化这些新功能。

  再往前想一步,当AI在现实世界中不再匮乏的时候,人类是否会被AI取代?

  就像马斯克说的那样,“我们离强大到危险的AI不远了”。OpenAI明年会推出更强大的GPT-4模型,据说可以通过图灵测试。

  多知网:ChatGPT完美吗?

  好未来AI团队负责人:答案当然是:不。

  ChatGPT有几个致命缺陷:

  1)输入不能有错。

  在使用ChatGPT时,必须要精确,哪怕是一个词的改变,答案都会完全不同。当输入问题,有时会得不到答案,修改输入后,就会得到答案。

  2)无法推理,也无法思考。

  对此,OpenAI坦承,由于ChatGPT学习到的知识只来自训练数据中的统计规律,而不是任何类似人类对世界复杂和抽象系统的理解,因此该系统可能偶尔会产生不正确或误导性的信息,并可能产生攻击性或有偏见的内容。

  3)此外,该机器人对2021年之后的世界知识“有限”,对于某些特定人群的问题也“知之甚少”。(训练数据截止到2021年)。

  多知网:ChatGPT未来有可能会开源使用吗?中国大陆能够使用吗?

  好未来AI团队负责人:ChatGPT 的背后离不开大模型、大数据、大算力。ChatGPT 成为AIGC 里程碑的背后,是算力发展和数字时代形成的大数据所共同支持的大模型训练,才能实现目前的效果。GPT系列的大模型训练基本已经形成了算力,数据,模型的垄断趋势。要知道,在OpenAI的API上,最大的限制因素就是成本。基于OpenAI的收费API构建的GPT-3系列应用在国外已经有300+,国内无法访问OpenAI的GPT3服务,目前中国大陆用户无法注册ChatGPT服务账号,对于OpenAI将来的开源,持悲观态度。

  不过,Meta(原Facebook)、Google等将来是可能会开源同类型模型的。

  多知网:如果能使用,ChatGPT的一些技术是否可以应用在教育场景中?

  好未来AI团队负责人:个人认为,ChatGPT可以应用在教育的一些场景。教育的场景是多元化的,有语文、历史等文科,数理化等理科,编程、科学等素质教育学科。ChatGPT在文科和素质学科场景下有着不错的应用场景,例如语文中的作文素材生成、历史事件的描述、编程的代码示例等。然而,数理化这种需要严密的逻辑推理的学科,对对话的质量有着比较苛刻的要求,不然ChatGPT生成的内容会对学生的学习起到一定的反作用。近期,由于ChatGPT的低质量答案,已经遭Stack Overflow封禁。因此,在理科方面ChatGPT因为自身准确率的原因,发挥的空间不大。

  目前,由于老师本身具体知识对错的分辨能力,ChatGPT可能对于老师的工作的效率有提升,特别在备课的素材整理环节,取其精华,去其糟粕。对于学生,个人能力的仍有限,ChatGPT对其是把双刃剑。

  多知网:ChatGPT是否有可能取代教育场景的某个场景?

  好未来AI团队负责人:以目前ChatGPT的能力,可以融入教育的一些场景,特别是学生的表达能力的锻炼,例如低年级的写作等。将ChatGPT与图像、语音的能力结合,可以有更好的应用场景,例如口语表达能力练习,将ChatGPT于语音合成、语音评测结合,和学生展开多轮对话,并对发音和内容作出回馈和点评。

  未来,随着技术的不断突破,ChatGPT的系列进阶版本,完全可以进化成为一个学习中的助教角色,辅助学生方方面面的学习。

  多知网:当前好未来AI技术的应用已经实现了哪些突破?

  好未来AI团队负责人:1)智慧教育AI开放平台已经形成,科技部2030重大专项中,智慧教育平台的建设已经形成。

  2) 在线虚拟助教样例

  体验链接:https://ai.100tal.com/virtual-assistant

  多知网:如果AI在教育领域要有质的突破 需要迈过哪几个槛?是数据?(有效、精准)还是其他?

  好未来AI团队负责人:AI在教育领域要有质的突破,还需要迈过很多个门槛,算法、算力、数据都需要有若干次突破才能达到所谓的质的突破。以算法为例,虽然目前AI算法在各个领域经常取得比较亮眼的结果,然而,更多的是大力出奇迹的结果,实质性的算法突破并未走向一条类似“摩尔定律”一样的可预测持续提升轨道。像ChatGPT使用的Transformer是2017年提出的结构,经过了5年在各个领域遍地开花。单从序列长度视角来看,Transformer擅长搞定3位数token(0~999),至多4位数token(0~9999),更高位数的显然需要更多的技术突破。另外,目前AI算法仅仅是数据驱动的,是统计机器学习的分支,是归纳法的集大成者。内置演绎逻辑的AI模型,能够进行类人推理的突破尚未出现。