现如今,我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生,它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用,但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些根本性的缺陷,例如“幻觉”的问题。这些问题的存在使得我们有必要进行中场思考,以便总结上半场的经验和教训,从而更好地开启下半场。
事实上,许多技术的发展和产品的演进背后都有其内在的逻辑,这是时代发展的内在动力。自去年 ChatGPT 于 11 月份发布以来,短短不到两个月的时间内,用户数就突破了近 1 亿,而此前最流行的互联网产品 TikTok 却花了近九个月的时间。可以说,过去的十几个月是一段极其梦幻的时期,对于我们这些从事技术和研发的人员来说,几乎每一天都可能见证一个新的历史时刻,OpenAI 的每一次动态都会引起了我们的高度关注,只因他们的许多技术往往能带来历史性的突破。
通用人工智能技术发展的日新月异且速度的明显加快也说明了,在还没有来得及消化旧技术的时候,新的概念就已经出现。并且在过去的十多个月里,我们基本上一直处于这样的状态,似乎唯一不变的就是变化本身,技术的变化和加速已经成为了一种常态。
技术的快速变化已经成为常态,导致我们所处的世界日益复杂。以汽车为例,其构造需要大量的零件和元器件,而智能车需要运行几亿行代码,显示出的系统复杂性已经超出了我们的认知能力。因此,我们现在正处在一个复杂系统的时代,面临的挑战也越来越复杂。
社会发展的不确定性与失控风险的增加,促使我们开始思考当下我们整个人类社会的一个共同命题,即应对这种失控的风险的能力,其中强大的认知能力就是关键。
但是,人类的认知能力有其极限。人类的智能作为一种典型的生物智能,发展速度相对缓慢,而机器的智能发展却迅速无比。因此,历史的发展使我们明白,我们需要考虑发展人机协作的认知,让机器协助我们理解这个复杂的世界,以应对日益增加的失控风险。
机器认知能力是随着算力和数据的增长而增长的,在算力和数据的加持下,其能力不断提升,以此来应对这个世界的复杂性,大模型的出现成为了一种必然。
现今已经涌现了各式各样的大模型,并且能力还在增长,我们见证着通用人工智能的到来和进步,包括语言模型,多模态模型和具身模型等方方面面。
通用人工智能(AGI)已然形成了一场新的革命。与以往如蒸汽革命、电力革命不同,通用人工智能创造的是智力本身,是渗透到我们整个社会每一根毛细血管的能力,这一场革命必将影响广泛且深远。
那么大模型究竟给我们带来了什么呢?
对于大模型的探索我们还需要更清晰地定位与认知。对于各个行业来说,相较于“通识”的全才,企业更需要的是“专识”的专家,所以在重视通用大模型的同时,垂类的领域大模型也是值得关注的。实际上通识专业认知能力是建立在通识能力基础之上的,“通用”是理解“领域”的前提,要“炼制”通用的大语言模型,一般来讲训练语料越是广泛而多样,通用大模型能力越强。
另外,大模型的“举一反三”能力也同样值得我们关注。以往在任务训练中,如果我们需要模型具备某一项能力,则需要去特定地训练这类任务,且任务与任务之间是不具备组合能力的。而大模型却能够将任意两种学科、技能进行组合创新,将两个不相关的能力进行组合使用。
大模型还具有强大地评估评价的能力。以往的模型训练都需要依赖标注数据来最终评估模型的好坏,而现在 GPT4 等优秀的大模型,经过适当的引导之后,也可以具备人类水平,甚至是专家水平的评估能力。
大模型对复杂任务的规划、执行和拆解能力也同样值得重视。对于类似数据分析、统计假设检验这种复杂的任务,即使是丰富研究经验的人员来完成,也需要半天时间才能输出报告,而只要 Agent 的能力足够强,大模型可以在数十秒内完成整个流程。
更值得关注的是,通用大模型在跨越专业的知识方面存在巨大优势。人类在大部分情况下,可能会成为某个行业的专家,但很难成为全才,这使得我们的平均通识水平并不高。而大模型极大地提升了人类在各个领域的通识水平,这使得大模型能够帮助人类完成跨系统、跨领域的专业工作,让跨系统边界的复杂系统认知成为可能。
在企业端市场也就是我们常说的 To B 市场,也将会因为 ChatGPT 的到来而迎来一场全新变革。与传统的汽车制造业类比,大模型对于 To B 市场的首要意义在智能引擎升级。To B 产品是建立在智能引擎基础之上的,传统数据驱动、知识驱动或者二者联合驱动的智能引擎,将会被全新的大模型引擎所重塑。
然而正如前文所述,大模型在领域复杂决策应用场景上仍然有明显的短板与不足,尚达不到领域专家的能力。因此,我认为未来仍是以大模型为代表的数据驱动与领域知识图谱为代表的知识驱动相结合的双引擎驱动模式。由大模型实现领域专家的直觉决策,由知识图谱实现领域专家的逻辑决策,唯有两者结合才能复现领域专家解决问题的能力。如果与传统的操作系统类比,大模型可以作为 To B 产品的控制器。作为具有一定的领域通识能力的大模型,有能力胜任企业级智能系统的控制器,协调传统的 IT 系统(比如数据库、知识库、CRM、ERP、BI 系统等)。
然而在上述产品研发中,我们仍然面临许多具有挑战性的问题。
研究千行百业的智能化应用,究其本质,是一个复杂的认知决策任务。在实际应用场景中,我们需要的是机器的复杂决策能力,复杂决策是领域应用的根本特点,这绝不是开放式闲聊所能解决的问题。复杂决策涉及到许多能力,如丰富的应用知识、复杂的决策逻辑、宏观态势的研判能力、综合任务的拆解能力、精细严密的规划能力、复杂约束的取舍能力、未知事物的预见能力和不确定场景的推断能力。
而在大模型中,尤为重要的也是最迫切需要解决的,是“幻觉”问题,也就是大模型容易胡编乱造一些虚假事实。这个问题在模型本身是难以解决的,ChatGPT 在很多领域可以“创造答案”,但当用户寻求正确答案时,ChatGPT 也有可能给出有误导的回答。GPT4 也无法完全解决幻觉问题,增大模型规模和训练量只能一定程度缓解。即使接入搜索引擎,NewBing 仍会不按材料进行回答,这和翻译、摘要中的观察一致。
最后,就是大模型缺乏领域“忠实度”的问题。大模型是从通用领域练出来的,它往往倾向于利用它在底座模型的通用领域学到的知识来回答问题,而不忠实于你给的行业的知识,不忠于你给的行业的文本。
到了 ToB 行业,究竟我们该如何去发展大模型?这需要我们深挖,去挖掘我们的场景和应用。
首先大模型应当是百花齐放的,过去大家目睹了 OpenAI 在通用大模型的成功,随后便一起挤在了通用大模型的赛道中,竞争尤为激烈。事实上在许多行业或领域中,垂类大模型的应用更值得我们去挖掘与研究。从通用大模型,到行业/领域大模型、场景大模型、科学/专业大模型,在很多垂直行业,需要有很多专业的科学大模型才能够胜任。
其中我尤为关注的是场景的智能化,我认为场景大模型将会是未来最可能率先落地的应用。因为通用大模型已经有很强的通识能力,通识能力再加上简单的岗位培训就能够胜任的工作,是最容易落地的,比如 HR、客服或窗口办事员等。这一类恰恰是我们可以快速形成有效的解决方案获得效果的场景。标准化、规范化、服务化的工作对机器来说是容易实现的。
另外关注的还有专业大模型,除了常常被提起的气象大模型,医学大模型之外。行业内还有更多的场景和复杂形态的数据能够被大模型使用和解决,如代码代码、基因、图、表等,且不同类型、结构的数据都可以使用预训练的方式进行处理。
而谈到场景应用落地的形态,具备决策能力的 Agent 将会是绕不开的话题。大模型已经成为推动自主智能体发展的重要引擎。由于 LLM 拥有惊人的计算以及各种复杂的认知能力,能够处理和理解庞大的数据集、更好地感知和理解世界。因而,大模型日益成为自治智能体的大脑。它们的“大脑”特质使得它们能够处理多样性的信息源,包括文本、图像、声音等,从而更全面地理解其周围环境。
自治智能体能够利用 LLM 负责的能力独立地执行任务、做出决策,并在没有人为干预的情况下进行学习和改进。这种自主性使得它们能够在特定任务中表现出惊人的灵活性和适应性,从而更好地满足各种需求。
以 Travel Agent 为例,Agent 在决策过程中需要具备许多能力,如环境认知、场景认知、工具使用、运筹规划、协同合作、意图理解、约束规划、个性适配等能力。
另外一个重要的产品形态,则是统一智能的企业的信息门户。现在企业中往往有着多个信息系统,如 ERP、OA、代码库、知识管理平台等等,未来大模型将能够利用它的通识能力、任务分解与规划能力,协调传统的 IT 系统(数据库、知识库等)进行协同工作。
最后一个值得大家关注的在于数据要素。数据要成为资产、进行流通和交易,会涉及到复杂的数据治理问题,对于数据库中错误的、违反常识的数据,过去那种由人力或是规则来进行处理的方式是难以胜任庞大的数据工作的。大模型的通识理解、常识理解有助于它进行数据治理、数据评估、数据分级等工作,使它成为数据价值变现的重要方式。
过去我们已经发现,不计成本的研发大模型,肯定是走不通的。而大模型能为我们节约许多成本。首先是人力的成本,过去传统特征工程中,要靠专家来进行特征标注的工作,现在大模型以简单的提示词就可以办到。
但大模型本身也带来了巨大的成本。大模型成本=训练成本+应用成本,需要引起重视,仍然不可忽视。GPT4 规模的大模型单次炼制成本接近 6300 万美金,绝大部分的企业都没办法承受这份花销。另外,高频应用有可能带来难以接受的应用成本,随着使用需求的增加,调用API的花费也是不容小觑的。
要想控制好成本,一定要靠大小模型协同,这是降低应用成本的有效方法。对于绝大多数简单例子(80-20 法则),传统的 BERT 模型就可解决,其应用成本可忽略不计。假若遇到需要一定常识理解、复杂推理的样本,才需要交由大模型完成。并且,小模型的作用绝不仅仅是降低成本,大模型与小模型可以互相补充,各取所长。在可解释性、可控性、推理速度上,小模型都是优于大模型的。
降低成本的另外一个思路是提升大模型与知识图谱的协同能力。在过去十年里,很多行业已经建立起了很多规模和质量都不错的知识图谱。大模型可以将其利用起来,主要有三个思路:
大模型的小型化也是降低大模型应用成本的有效思路之一,是大模型普及应用的重要趋势之一。借助人类大脑功能分区理论对大模型的功能集约性开展研究是根本,小型化能够帮助大模型在手机端等设备上的部署。
大模型的时效性也十分需要重视,时效性是发展大模型的核心竞争力之一。如金融数据这类场景,如果做不到实时数据的获取与分析,其金融的决策是没有意义的。保证时效性的隐性方法包括知识编辑和持续学习,显性方法包括记忆增强、检索增强和接入互联网增强。
在大模型这个行业里面,我们需要合理定位、正确认识,场景多元,积极开辟新赛道,重视大模型的成本与价值,促进大模型与千行百业的深度融合。大模型不能只是炼金术,要成为科学才能持续发展;大模型背后的“人”学研究是关键。