行业动态

第四范式发布“式说大模型”,以生成式 AI重构企业软件AIGS

发布时间:2024-04-27 浏览数:15493
4 月 26 日,第四范式首次向公众展示其大模型产品「式说 3.0」,并首次提出AIGS 战略(AI-Generated Software):以生成式 AI 重构企业软件。式说将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现「AIGS」。

第四范式创始人兼 CEO 戴文渊表示:「C 端产品已经逼近用户体验的上限,而 B 端的企业级软件往往是个十分复杂的执行系统,堆砌十几层菜单和成千上万功能也不算多。」

戴文渊认为,目前这些 B 端软件极为复杂的交互体验,以及复杂性带来的极低开发效率,恰恰为生成式 AI 留下足够大的重构和改造空间。

「过去很难通过人类语言(自然语言)的方式去调用企业软件的功能,现在当我们有更强的语义理解和生成能力,再加上 GPT 任务翻译、任务分发和推理的能力,就可以通过更好的「对话框式」交互方式实现功能的调用,不再需要找到某个位于十几级的菜单目录之下的功能。」

这背后还是大模型的能力。第四范式现场拔网线,展示了式说大模型的图片理解、多轮对话、写小说、迅速画图等能力。

基础能力 demo 

此外,现场展示了式说通过推理能力完成更加复杂的「装箱」操作,以及其现场编写代码的能力。

装箱和写代码 demo 

在戴文渊看来,要做到 AIGS,大模型未必需要是知识广博、十项全能冠军的通才,更重要的在于模型具备 Copilot(副驾舱),和思维链 CoT(chain of thoughts,多步推理)的能力。

「要去改造企业软件,大模型不能只有语言能力。式说 2.0 就加入了多模态和 Copilot,因为很多企业软件里的数据是多模态的,而 Copilot 能把人的指令翻译成要调用后台的哪个 API。」此前发布的式说 2.0 的 Demo 中,门店员工通过语音、文本等交互方式向式说发起指令,式说理解后,联网门店监控软件调出后厨未戴口罩的图片,并直接将图片以对话框的形式输出给员工。

大模型去调用软件内置的一个个功能、数据来「对话框式」完成任务,已经能产生巨大价值。但员工用企业软件时也会面临复杂任务,需要人按照顺序执行一个个功能。

因此,式说 3.0 强调的是 Copilot 加上思维链 CoT,具有更强的推理能力,在学习大量数据和「攻略」后,能形成中间的逻辑推理步骤,从而做到拆分并执行复杂工作。

第四范式将 AIGS 的路径总结为三个阶段:

第一阶段,Copilot 调动不同的信息、数据、应用,作为助手完成用户的指令。相当于在所有企业级软件系统里,配备一个指挥官。指挥官听用户的指挥,比如「把照片亮度调亮 20%」。

第二阶段,Copilot+基于企业规则的「知识库」,AI 能够参照规则做复杂工作,进一步丰富了「对话框」的能力。比如 AI 查询了「人像美化」知识库后,能执行把照片修好看的步骤。

第三阶段,Copilot+CoT(思维链)。软件系统的使用行为最终会被大模型学会,形成 AI 针对这个领域的思维链,意味着「把照片处理得更好看」这种复杂指令,AI 能自动地按照步骤完成。

第四范式的 AIGS 战略,就是指基于式说大模型背后的 Copilot+COT 能力,把企业软件改造成新型的交互范式,并在新型交互上不断地学习软件的使用过程,形成领域软件的「思维链」。

在我国航空制造代表企业的实际场景演示中,其与第四范式基于 Copilot 技术,联手改造了某工业设计软件。

零件搜索和装配 demo 

现场某医疗行业的实际场景演示中,式说的「思维链」能够清晰指出将药品销售出去的具体步骤。

医药代表赋能 demo 

最终,由于新的交互形式的出现,企业软件的开发效率变得更高。以前是功能和执行逻辑被编排在软件界面,每次一个功能升级,都要周而复始的经历原型图、设计、开发等,至少是月级别的开发时间。而现在由于「对话框式」的界面是固定的,功能和逻辑被改写在数据、API 和内容层面,变成了天级别的开发效率。

值得一提的是,在式说 3.0 发布现场,来自航空制造、金融、医疗等行业的客户代表出席并做产品的 live demo 演示。ChatGPT 出现的短短两个月内,众多企业与合作伙伴已经与范式在生成式 AI 方面开展了深度合作。式说作为基于大模型的新型开发平台,期待与更多合作伙伴与企业客户及一起,探索以生成式 AI 重构企业软件的机会,共同提升企业软件的易用性和生产力。

 

  • 第四范式AIGS战略背景材料

关于大模型:

1、第四范式什么时候开始关注投入 GPT和大模型:

在 BERT 出来的时候,范式研究院就开始关注并投入在这个技术领域,GPT3 出来以后更加明确了要朝这个方向。不过相比今年的投入,过去几年肯定还是有差距的。ChatGPT 对我们最大的帮助,就是整个市场的信心一下从 0 调满了,确定性的投入更大了,再往后就是变成产品、变成商业化的路线往市场去推。

2、是否跟同行做过对比?

中国目前还没有像 OpenAI 那样在大模型上绝对领先的公司,也会有更多的大模型。大模型是新的生产力,大家都得有大模型作为底座,所以入局的门槛确实是变高了。

但是在达到这个门槛之后,重点在于如何选择方向。比如培养了一个大学生后,到公司再接受专业的训练,在某一个领域积累专业的能力,这是很重要的。但不具备一定的素质有很多事就干不了,所以底层的大模型也很重要。

第四范式认为比较大的机会在于改造整个的企业软件行业,也就是 AIGS 这个方向。发力的大模型技术方向是 Copilot 可控(执行可控、知错能改),和思维链 COT((chain of thoughts,多步推理、复杂任务拆分)的能力,形成数据飞轮(比如将某垂直领域的数据和流程投入大模型,很快可以形成模型在该领域的思维链)。

3、式说在短短两个月的时间已经发布了 3 个版本,从 1.0-3.0这中间的迭代过程是?

1.0——ChatGPT 火了之后,大部分的客户和伙伴还没有真的使用上 GPT 类似的技术,我们当时出了第一代的产品。式说 1.0 有生成语言的能力,并且解决 GPT 技术应用时内容可信、数据安全和成本的三大问题。当时主要的场景就是文库问答,相当于让 GPT 学习的企业知识后,可以解答专业问题,并且是可溯源的。

2.0——在式说语言能力基础上,加入了文本、语音、图像、表格、视频等多模态输入及输出能力,并增加了企业级 Copilot 能力。以与企业内部应用库、企业私有数据等进行联网,对信息和数据进行分析,回答员工的问询或执行相关任务,从知识助手成为业务助手。

3.0——在生成式和语言能力的基础之上,3.0 发力 Copilot 和思维链 COT(多步推理、复杂任务拆分、形成数据飞轮),改造传统 B 端企业软件的体验与开发效率,我们叫 AIGS(AI generated software),以生成式 AI 重构企业软件。

关于 AIGS

4、为什么想到做 AIGS(software)?什么是 AIGS

C 端的软件体验在过去的十几年已经被打磨到了比较高的水准,你用对话未必就一定更好用。但是 B 端(想象一下在企业报销系统、HR 系统、OA 系统),体验还是比较差的。可能你在菜单里面点一个下拉菜单,再点下拉菜单,再点几下才能进入到某一个功能。

过去很难通过自然语言的方式去调用这些功能,现在当我们有更强的语义理解的自然语言的时候,可以通过更好的交互方式去实现功能的调用,从而实现用新型的通过语音/对话的交互模式,去替代老的交互,从而使 B 端企业软件的体验迅速一个颠覆式的提升。

其次是开发效率的提升。原先 B 端企业软件都是高度定制化的,基于菜单式的开发,基本每次一个功能升级,又要产品经理画界面,设计、开发等,至少是月级别的开发时间。而由于新的交互形式的出现,以前是功能和执行逻辑被编排在软件界面,现在功能和逻辑被改写在数据、API 和内容层面,变成了天级别的开发效率。

就像 ChatGPT 不再是一个复杂的菜单和一堆的功能,只需要一个对话框就能做很多事情。并且它背后每天都在迭代,但你感受不到它的界面发生了什么变化。以前软件是在界面层面的升级,未来是在数据层面的升级。

我们看到大模型能够带来用户体验的提升,开发效率的提升,所以一定会形成软件行业的飞跃,就是谁率先能做出来的问题。这是一个巨大的市场。大模型是新的生产力,以大模型基础设施为先导项目,改造整个软件产业,整个行业的业务价值、商业模式都会得到飞跃。

5、式说如何能实现 AIGS

去改造软件大模型不能只有语言能力。式说 2.0 就加入了多模态和 Copilot,因为很多企业软件里的数据是多模态的,而 Copilot 支持用对话去调用软件内置的一个个功能/数据来完成任务。2.0 的时候,员工可以通过语音、图像、表格、视频等多模态方式向式说发起询问或下达指令,式说理解之后,联网企业软件调出有关功能,并以所需要的形式输出答案。

我们去完成任务的时候,往往不完全是一个功能。比如说图像处理软件,如果你要调亮度、对比度,这是功能。但如果是将人物 P 瘦一点,它就不是一个单一功能能实现的了。这背后需要人按照经验,执行软件的一个个的功能才能实现。

人接收到复杂的工作,会在大脑里推理出一步步要执行的子任务,然后再按步骤去执行。换成机器,如果对于同一个工作,机器在过去见到过足够多的人(累积数据)通过一二三四步把这个工作完成了,它已经可以这个套路总结出来,就形成了思维链。

所以式说 3.0 强调的是 Copilot 加思维链 CoT。大模型用更强的 CoT 推理能力,去不断学习新领域的思维链,相当于用软件本身的使用行为,去构建 AI 针对这个领域的思维方式。

对于企业软件合作伙伴来说,可以基于范式的大模型能力,在一个个领域里面钻的足够深,学习到足够多的数据,最终所形成领域的思维链,发展成「领域」大模型。当思维链复杂度到一定程度以后,它的软件就能够自动执行越来越复杂的功能。

6、过去范式做的事对此有什么积累?

首先,范式拥有做大模型的技术能力。虽然先知不是做通用模型的定位,当时定位是做专用模型,但先知一直强调模型是要高维的,所谓的高维其实就是参数,要把模型做大,就像 GPT3.5 是 1700 多亿的参数,这是从技术上来说能平移过去的地方。此外范式拥有国内领先的研究院、工程化、产品力的全栈技术能力。

其次,范式原有市场和新市场所面对的产业链正好是上下游。以前 AI 更像是一种重要零件或者元器件,这些以外的其他地方不是 AI 覆盖,是企业软件覆盖。企业软件经过了这么多年发展,基本上能把所有的事都覆盖了。范式和软件公司一直互为生态,范式做的是软件里面的 AI 决策,软件公司做功能和流程的实现。比如 AI 预测出门店明天要运多少鸡翅,这需要放到门店管理的系统里。

我们互相共生也很了解,看到 GPT3 时已经知道了,是可以帮助到企业软件市场的。做这个事情还是需要非常强的一个行业积累,第四范式过去几年在行业里面扎得还是比较深的,我们对 AI 产业化的深层次理解,更清楚明白大模型作为新生的生产力工具,如何落地才能产生最大的价值。

来源:极客公园 (侵删)

给老板发邮件

提交

信息将直接提交到老板邮箱,会有专人联系您!