第A06版:A06

ChatGPT的“创造性破坏”效应及其风险应对

◇高奇琦

2022年底OpenAI发布的ChatGPT,在世界范围内引发了使用的浪潮,鲜明反映了一种通用人工智能突破的可能性。考察ChatGPT所代表的通用大模型的生产力意义,进而分析ChatGPT可能造成的“创造性破坏”效应及其风险,对于我们积极应对通用大模型带来的整体性风险具有积极的现实意义。

以ChatGPT为代表的

通用大模型及其生产力意义

ChatGPT是OpenAI开发的一个基于Transformer模型的改进版通用模型。迄今,OpenAI已经发布了GPT(生成预训练转换器)的4个版本,分别是GPT-1、GPT-2、GPT-3和ChatGPT。其中,ChatGPT可以看成GPT系列的3.5版本。由于在GPT前面加了“Chat”的前缀,使得ChatGPT更像是一个聊天机器人。

然而,ChatGPT之所以在世界范围内引发热议,实际上体现了其代表一种通用人工智能突破的可能性。这种大模型是在传统的深度神经网络算法基础之上,由于训练的参数量增加而形成的新模型。之所以被称为大模型,是因为其训练的参数数量已经达到千亿级别。

通用大模型反映的基本逻辑是“大力出奇迹”,即由于参数量增加,在大模型的基础之上,之前并不起眼的算法会出现某种令人惊奇的智能涌现,这便是大模型的生产力含义。在2016年“AlphaGo战胜李世石”事件的影响下,近年来人工智能实现了一次巨大的发展,但仍然是以专用人工智能为中心,其本质仍是弱人工智能。而ChatGPT的表现,不仅擅长聊天,而且在生成文本以及编写代码等方面具有巨大潜能。换言之,ChatGPT使人们相信,之前还遥不可及的通用人工智能,可能在未来的某个时间点会出现涌现式的突破,从而意味着第四次工业革命即智能革命的大门已经打开。

关于ChatGPT热议的一个关键问题是:为什么这样的创新没有出现在谷歌,反而出现在许多人并不熟悉的OpenAI公司?其实,OpenAI的成功是多重因素作用的结果。一方面,OpenAI公司实现的技术性突破源于一种科技创新的长期主义。另一方面,从产品的角度来讲,这样的创新确实更有可能在“非在位企业”中出现。这是因为“在位企业”往往对颠覆式创新产品畏手畏脚,同时公众对其品牌产品也比较苛责。此外,ChatGPT在与人对话时,会强调自己还是一个聊天机器人,观点是不一定准确的,这种谦卑态度使得用户对其出现的各种奇怪错误有更大的包容性。

另一个关键问题是,这样的创新为什么没有出现在中国?这本身就反映了中国科技创新意识的自觉,体现出中国社会在原始创新方面的愿望比较强烈。不过,问题的背后更多是对中国企业需要在“长期主义”的基础上去思考基础性原始创新的期待,也隐含着一种对国家在相关制度配套方面给予原始创新更大发展空间的建议。

ChatGPT的“创造性破坏”

效应及其风险

约瑟夫·熊彼特认为,每一次巨大的创新都会对旧的技术和生产体系产生巨大的冲击,即“创造性破坏”。面对ChatGPT具备的潜能,我们需要思考未来一旦通用人工智能形成突破之后,可能会对整个社会产生巨大的创造性破坏效应,即可能产生多方面的风险。

第一,技术风险。技术被用来推动社会的发展,也可被用来规避风险,然而技术本身就是新的风险源头。许多技术自身可能存在一些缺陷或者不完备性,ChatGPT同样存在着这样的不完备性。GPT是在Transformer模型的基础上发展而来的,而Transformer的发展又与深度神经网络中的卷积神经网络(CNN)、循环神经网络(RNN)、生成式对抗模型(GAN)等进展紧密联系在一起。正是源于这些进展的基础都是人工的深度神经网络,其不可解释性自然是客观存在的。换言之,在海量参数基础上训练出的模型尽管可以帮助解决问题,但是人们并不知晓其运行的基本逻辑。因此,这样的通用大模型会存在鲁棒性不足的问题。另外,GPT令人惊奇的对话效果,实际上建立在人类长期形成的大量数据的基础上,而已有的数据不可避免会形成某种偏误。质言之,这些模型的已有数据来源夹杂着人类社会长期存在的诸多成见,那么由此训练出的模型无疑会造成“成见叠加”的效应,存在引发各种危险的可能性。

第二,社会风险。就目前的预测效果来看,通用大模型的广泛应用确实会对诸如文案写作、基本交流、会计统计、法律辅助等初级简单劳动形成替代效应。尽管新的技术条件会创造新的就业机会,但是如何确定新产生的就业机会能够多于被淘汰的就业机会?同时,通用大模型对教育体系的冲击已开始引发预警。一些学校宣布禁止学生使用ChatGPT,避免干扰教育质量。另一种观点认为,这样的先进生产工具恰恰需要学生第一时间去学习。可见,ChatGPT的出现对未来的教育方式和教育评价等都提出了巨大挑战。

第三,经济风险。通用大模型可能会加剧寡头垄断。通用大模型训练极为消耗算力,这就使得小型企业无法参与到这一过程,而大平台企业公司便有可能提高垄断大模型的产生形成巨大的生产力效应。另外,市场垄断还可能对整个世界分工体系产生重大影响。目前美国的战略打压行动已经说明更希望锁闭这样的先进生产力,即通过“小院高墙”战略把先进生产力更多地留在美西方俱乐部的盟友体系中,避免向发展中国家扩散。这会严重加剧国际间的经济冲突。

第四,政治风险。美国在通用大模型的开发上表现出明显优势,而大模型很可能会被用在政治竞争的各个领域。例如,通过智能水军对他国舆情进行肆意干扰,甚至推行颠覆他国的舆情战。在所谓民主化浪潮中,美西方国家已经运用推特等技术手段干涉他国内政。可以预见的是,通用大模型很有可能会被用于舆情干扰和政权颠覆等政治活动中,美西方国家凭借高科技强化政治战的手段,将对世界政治产生巨大的颠覆性影响。

应对相关风险的基本原则

积极应对通用大模型带来的整体性风险,需要坚持如下几个原则。

第一,开放创新。因害怕风险而终止创新,无疑是主动放弃了智能革命领导权的问题。目前,世界已经站在第四次工业革命的门口,中国和美国都可能会成为第四次工业革命的领导者,机遇与挑战并存。这就需要我们采取一种开放创新的态度,不断走在世界创新的最前沿,通过一些原始创新来获得并保持创新的先发地位和优势。

第二,合力突破。这需要我国进一步发挥新型举国体制的优势。要实现这样的通用大模型的推进,算力是一个重要的科技生产力条件,有必要在政府协调的基础上形成较大规模的公共算力池。另外,在数据方面要形成合力。譬如,目前中文的数据被分散在不同企业的App之中,有必要通过公共协调机制创新方式实现大型企业数据的共享,进而提高数据的质量,为大模型的深度开发提供基础。

第三,风险共担。在通用大模型发展的背景下,需要政府发挥更大的制度保障功能。如通过失业保障和再就业培训等方式,有效转化替代效应,创造新的工作岗位,或者完善社会保障解决失业产生的各方面问题。在风险共担的背景下,把创造性破坏产生的巨大风险防范在一个可控范围内。同时,随着逐步解决风险点,大力强化创造性效应产生的新生产力,不断实现财富增加,优化应对整体风险体制。

第四,审慎监管。政府需要对大模型提供方进行监管,实时评估“强监管”与技术创新效果,审慎调整监管手段,始终保障我们在智能革命中处于较为领先的地位。如在新技术产生的前期,可以采用某种“弱监管”或者“沙盒监管”的方式,积极鼓励技术率先出现带来的社会效益,再通过敏捷治理的方式,将可能产生的负面效应控制在一定的环境和空间中。通过这样的技术试点方式,切实保障技术创新成长的空间和机会,有序强化监管的综合效果。只有不断完善审慎监管环境,才有可能推动原始创新更多地出现在中国。 

(作者系华东政法大学政治学研究院院长、教授)