一鼎盈配资_股票配资融资

AI大模型专家访谈丨天津大学智能与计算学部熊德意：国内更需关注底层技术的研发，为全栈自主能力准备

2024-04-24 【字体：大中小】

　　12月28日，2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会（下称“大会”）将在成都市正式举办。

　　一方面，大会邀请权威机构及高校专家组建了“大模型基准评测专家委员会”，将对国内大模型开展评测工作，深入了解当前国内大模型的能力水平以及大模型企业发展情况。另一方面，头部企业、专家学者、国内权威标准制定机构等将在大会齐聚一堂，共同探讨行业发展趋势，搭建产业上下游沟通平台，推动大模型技术的进步。

　　日前，红星资本局专访了天津大学智能与计算学部教授、博士生导师熊德意。作为天津大学“语言智能与技术”中外联合研究中心（天津市“一带一路”联合实验室）主任，他详细讲解了什么是自然语言处理，什么是人工智能大模型，以及人工智能大模型的发展情况、中外差距、评测标准等。

　　以下是对话实录：

大模型是人工智能的重大突破

缩小了机器智能与通用智能的距离

　　红星资本局：什么是人工智能大模型？人工智能大模型目前处于什么样的发展阶段？

　　熊德意：以前人工智能都是弱人工智能，通常只能完成一种任务，比如AlphaGo只能下围棋。而大模型是通用智能，像人类智能一样，可以完成很多任务。这是人工智能未来发展的终极方向。

　　大模型是人工智能的重大突破，它大大缩小了机器智能与通用智能的距离。人现在可以做的一些工作，以后机器可能也能做，尤其是需要脑力的地方。工业化是机械取代了人类的体力劳动，未来通用智能会解放人类的脑力劳动。

　　2022年底出现的ChatGPT是人工智能大模型发展的标志性事件，推动了普通大众对大模型的普遍关注。以ChatGPT为代表的大模型的出现，是人工智能一次飞跃性的发展。AI大模型目前处在通用智能的非常初级的阶段，是从弱人工智能向强人工智能、通用智能的分水岭迈出了第一步。如果未来通用人工智能真正实现了，回首再看，可以认为2023年是产生通用智能雏形的时间节点，相当于当年第一台计算机的发明。

　　红星资本局：什么是自然语言处理？智能音箱是自然语言处理吗？

　　熊德意：通俗地说，自然语言就是人说的话、书写的文字。自然语言跟机器语言、数学语言相比最大的不同是存在歧义性，就是它可以有各种理解方式。各种歧义性组合在一起，就是一个爆炸性的问题。自然语言处理就是使计算机能够理解自然语言，生成自然语言，具备类似人的听说读写译这些语言能力。

　　智能音箱是自然语言处理研究的一个应用分支，它是一种叫对话式AI的技术，让机器跟人进行对话，来完成一些用自然语言描述的任务，如根据用户以自然语言发送的询问天气的请求，查询天气并用语音方式反馈给用户。目前智能音箱的功能简单且有限，真正的自然语言处理的应用范围远比智能音箱广泛。

　　红星资本局：自然语言处理与人工智能大模型有什么关系？

　　熊德意：大模型最开始诞生于自然语言处理。大模型包括大语言模型、视觉大模型、语音大模型、多模态大模型等。大语言模型起初解决的问题是要让计算机理解人说的话，生成的话人能看得懂，这必须有一个底层模型去帮它建模语义语法。语言是单词通过语法规则、语义规则、篇章规则及更高层的文化约束去组成句子、篇章、文章，单词之间具有的内在逻辑关系也具有统计规律，这些可以通过某种概率模型来建模。

　　大模型的底层架构Transformer最开始是为机器翻译专门发明的，之后再推广到语言模型，形成现在的大语言模型，再延伸至AI其它领域的各类大模型。大语言模型的参数规模现在已经发展到上万亿，海量的训练数据，加上大规模算力，通过标度律叠加在一起，一下就把大模型的语言功能给打通了。机器掌握人类的语言之后，就可以跟人类用自然语言进行交互。大模型理解了人类的语言之后，其发展空间将是非常巨大的。

　　这是因为智能跟语言密不可分。人类的思想，科技、历史、文明都是通过语言文字来记载和承载的。AI在学习语言的同时，也把语言承载的知识学会了。我们希望未来AI能用这些知识解决复杂的问题，像人一样进行推理、发明和创造。从语言到知识再到智能，这就是大模型到通用人工智能的总体路线图。

　　自然语言处理则是AI的一个分支方向，但是它比AI诞生得还要早，在AI这个概念出来之前，就已经有用机器去做语言的自动化处理。

国内的大模型研究偏向应用

更需要关注底层技术的研发突破

　　红星资本局：目前国内外大模型发展的情况具体如何？

　　熊德意：国内以前也有一些预训练模型，技术上我们一直在跟进，底层架构技术国内都是有的。

　　从GPT3到3.5，虽然版本只有0.5的变化，但是技术上更新换代的颠覆性远超之前从1到3 ，因为它引入了一项很重要的技术——人类反馈强化学习（RLHF）。这是一种AI对齐技术，就是让大模型跟人类的价值观、人类的目标对齐。在国内这个技术（AI对齐）没有很好地跟进，所以去年底ChatGPT出来之后，就显露出国内外的差距。

　　RLHF基于高质量的指令、价值对齐数据，通过有监督微调、人类偏好奖励建模和强化学习，使大模型获得很好的指令遵循、人类意图对齐能力，同时也“解锁了”大模型的跨任务、跨语言指令泛化能力。哪怕只是利用指令数据有监督微调预训练基座模型，效果也立竿见影。上半年国内很多企业和高校发布了自己的大模型，甚至出现了“百模大战”的景象，有监督微调发挥了重要作用。

　　上半年大家的确做出了很多大模型成果，但从技术的角度来说，差距并没有显著缩小，甚至可能更大，我们在追赶，但是别人也没有降低大模型研发的节奏。

　　美国有很好的战略科学家，对通用人工智能的底层算法、AI对齐等技术，有非常长远、深刻的认识。他们很早就提出和讨论了通用人工智能技术路线、AI对齐技术路线图，很多团队都是围绕这些技术路线在不断推进算法，让大模型能力更强，更能对齐人类的目标。

　　最开始的大模型架构、训练的分布式框架，都是由美国的AI头部企业提出，我们在大模型的研究中似乎更偏向应用，底层算法的一线人才和通用人工智能、AI对齐的顶层战略科学家较为缺乏。因此，我们更需要关注底层技术的自主研发和突破，以及对未来通用人工智能技术路线的顶层思想探索。未来大模型很多技术和软件可能不会开源了，现在已经有关于开源和闭源的争论。因此，我们现在就应该为大模型全栈自主研发能力准备，建设大模型软硬件、算法、数据、评测、人才等全方位的生态体系，避免未来被卡脖子。

大模型评测标准非常有必要

主要有能力和安全性两个维度

　　红星资本局：现在国内有很多企业切入大模型赛道，业内认为应当推出一个评测标准。你认为大模型评测标准有存在的必要性吗？评测标准应该是什么样的？

　　熊德意：评测标准是非常有必要的。大模型评测主要有两个维度，一个是综合能力，即完成任务的能力达到什么水平。大模型是通用人工智能，通用就是综合性、多任务性，因此，需要建立多维度、多基准、全面、综合的评测标准。

　　另一个维度是对齐，或者说安全。大模型是一把双刃剑。用得好，可以造福社会和人类，用得不好，将带来安全隐患和风险，远的安全担忧是随着机器智能水平的不断提升，机器是否还按照人类赋予的目标行事，国际上很多研究机构和AI专家，对通用人工智能发展一直持谨慎态度，包括OpenAI。

　　近的安全担忧主要是大模型带来的社会伦理风险。比如，目前的大模型具有幻觉，就是一本正经地胡说八道。举个例子，曾有一名美国律师使用ChatGPT辅助写诉状，结果ChatGPT杜撰了多个完全不存在的案例。

　　另外一个重要的伦理风险是对大模型的滥用。大模型拥有大量知识，包括很多涉险、敏感知识，一旦被居心不良的人使用，可能带来安全隐患，如研制生化武器、进行网络攻击等。

　　为了防止大模型出现短期的社会伦理风险及未来不可控的安全担忧，需要对大模型进行全面深入的评测，监控大模型的能力发展，以便在出现风险之前能够及时发出安全警示。评测是大模型落地前非常重要的环节，国际学术和产业界也普遍认为，需要在技术评测的基础上对大模型实施安全审查。

　　红星资本局：国内现在有没有机构和标准去评测？

　　熊德意：现在国家有多个部门和组织在做大模型的相关标准。这次要举办的人工智能大模型基准测试科创发展大会，就是依托相关的标准，对国内大模型进行综合评测。国际上,像英国、美国，已经开始筹备建立高级别的人工智能安全研究机构。今年11月初在英国举行的首届全球人工智能安全峰会，中方代表团应邀参加，联合签署了AI安全《布莱奇利宣言》。实际上，我们在今年10月份举办的第三届“一带一路”国际合作高峰论坛上，率先发布了《全球人工智能治理倡议》，比英国这个峰会还早，中方代表团在英国峰会上积极宣介了中方提出的《全球人工智能治理倡议》。

　　人工智能的治理问题非常重要，上面提到的很多安全隐患，需要全球联合起来共同治理，以共建安全和谐的人类命运共同体。

　　红星新闻记者吴丹若