AI大模型专家访谈丨天津大学智能与计算学部熊德意:国内更需关注底层技术的研发,为全栈自主能力准备
2024-04-24 【 字体:大 中 小 】
12月28日,2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会(下称“大会”)将在成都市正式举办。
一方面,大会邀请权威机构及高校专家组建了“大模型基准评测专家委员会”,将对国内大模型开展评测工作,深入了解当前国内大模型的能力水平以及大模型企业发展情况。另一方面,头部企业、专家学者、国内权威标准制定机构等将在大会齐聚一堂,共同探讨行业发展趋势,搭建产业上下游沟通平台,推动大模型技术的进步。
日前,红星资本局专访了天津大学智能与计算学部教授、博士生导师熊德意。作为天津大学“语言智能与技术”中外联合研究中心(天津市“一带一路”联合实验室)主任,他详细讲解了什么是自然语言处理,什么是人工智能大模型,以及人工智能大模型的发展情况、中外差距、评测标准等。
以下是对话实录:
大模型是人工智能的重大突破
缩小了机器智能与通用智能的距离
红星资本局:什么是人工智能大模型?人工智能大模型目前处于什么样的发展阶段?
熊德意:以前人工智能都是弱人工智能,通常只能完成一种任务,比如AlphaGo只能下围棋。而大模型是通用智能,像人类智能一样,可以完成很多任务。这是人工智能未来发展的终极方向。
大模型是人工智能的重大突破,它大大缩小了机器智能与通用智能的距离。人现在可以做的一些工作,以后机器可能也能做,尤其是需要脑力的地方。工业化是机械取代了人类的体力劳动,未来通用智能会解放人类的脑力劳动。
2022年底出现的ChatGPT是人工智能大模型发展的标志性事件,推动了普通大众对大模型的普遍关注。以ChatGPT为代表的大模型的出现,是人工智能一次飞跃性的发展。AI大模型目前处在通用智能的非常初级的阶段,是从弱人工智能向强人工智能、通用智能的分水岭迈出了第一步。如果未来通用人工智能真正实现了,回首再看,可以认为2023年是产生通用智能雏形的时间节点,相当于当年第一台计算机的发明。
红星资本局:什么是自然语言处理?智能音箱是自然语言处理吗?
熊德意:通俗地说,自然语言就是人说的话、书写的文字。自然语言跟机器语言、数学语言相比最大的不同是存在歧义性,就是它可以有各种理解方式。各种歧义性组合在一起,就是一个爆炸性的问题。自然语言处理就是使计算机能够理解自然语言,生成自然语言,具备类似人的听说读写译这些语言能力。
智能音箱是自然语言处理研究的一个应用分支,它是一种叫对话式AI的技术,让机器跟人进行对话,来完成一些用自然语言描述的任务,如根据用户以自然语言发送的询问天气的请求,查询天气并用语音方式反馈给用户。目前智能音箱的功能简单且有限,真正的自然语言处理的应用范围远比智能音箱广泛。
红星资本局:自然语言处理与人工智能大模型有什么关系?
熊德意:大模型最开始诞生于自然语言处理。大模型包括大语言模型、视觉大模型、语音大模型、多模态大模型等。大语言模型起初解决的问题是要让计算机理解人说的话,生成的话人能看得懂,这必须有一个底层模型去帮它建模语义语法。语言是单词通过语法规则、语义规则、篇章规则及更高层的文化约束去组成句子、篇章、文章,单词之间具有的内在逻辑关系也具有统计规律,这些可以通过某种概率模型来建模。
大模型的底层架构Transformer最开始是为机器翻译专门发明的,之后再推广到语言模型,形成现在的大语言模型,再延伸至AI其它领域的各类大模型。大语言模型的参数规模现在已经发展到上万亿,海量的训练数据,加上大规模算力,通过标度律叠加在一起,一下就把大模型的语言功能给打通了。机器掌握人类的语言之后,就可以跟人类用自然语言进行交互。大模型理解了人类的语言之后,其发展空间将是非常巨大的。
这是因为智能跟语言密不可分。人类的思想,科技、历史、文明都是通过语言文字来记载和承载的。AI在学习语言的同时,也把语言承载的知识学会了。我们希望未来AI能用这些知识解决复杂的问题,像人一样进行推理、发明和创造。从语言到知识再到智能,这就是大模型到通用人工智能的总体路线图。
自然语言处理则是AI的一个分支方向,但是它比AI诞生得还要早,在AI这个概念出来之前,就已经有用机器去做语言的自动化处理。
国内的大模型研究偏向应用
更需要关注底层技术的研发突破
红星资本局:目前国内外大模型发展的情况具体如何?
熊德意:国内以前也有一些预训练模型,技术上我们一直在跟进,底层架构技术国内都是有的。
从GPT3到3.5,虽然版本只有0.5的变化,但是技术上更新换代的颠覆性远超之前从1到3 ,因为它引入了一项很重要的技术——人类反馈强化学习(RLHF)。这是一种AI对齐技术,就是让大模型跟人类的价值观、人类的目标对齐。在国内这个技术(AI对齐)没有很好地跟进,所以去年底ChatGPT出来之后,就显露出国内外的差距。
RLHF基于高质量的指令、价值对齐数据,通过有监督微调、人类偏好奖励建模和强化学习,使大模型获得很好的指令遵循、人类意图对齐能力,同时也“解锁了”大模型的跨任务、跨语言指令泛化能力。哪怕只是利用指令数据有监督微调预训练基座模型,效果也立竿见影。上半年国内很多企业和高校发布了自己的大模型,甚至出现了“百模大战”的景象,有监督微调发挥了重要作用。
上半年大家的确做出了很多大模型成果,但从技术的角度来说,差距并没有显著缩小,甚至可能更大,我们在追赶,但是别人也没有降低大模型研发的节奏。
美国有很好的战略科学家,对通用人工智能的底层算法、AI对齐等技术,有非常长远、深刻的认识。他们很早就提出和讨论了通用人工智能技术路线、AI对齐技术路线图,很多团队都是围绕这些技术路线在不断推进算法,让大模型能力更强,更能对齐人类的目标。
最开始的大模型架构、训练的分布式框架,都是由美国的AI头部企业提出,我们在大模型的研究中似乎更偏向应用,底层算法的一线人才和通用人工智能、AI对齐的顶层战略科学家较为缺乏。因此,我们更需要关注底层技术的自主研发和突破,以及对未来通用人工智能技术路线的顶层思想探索。未来大模型很多技术和软件可能不会开源了,现在已经有关于开源和闭源的争论。因此,我们现在就应该为大模型全栈自主研发能力准备,建设大模型软硬件、算法、数据、评测、人才等全方位的生态体系,避免未来被卡脖子。
大模型评测标准非常有必要
主要有能力和安全性两个维度
红星资本局:现在国内有很多企业切入大模型赛道,业内认为应当推出一个评测标准。你认为大模型评测标准有存在的必要性吗?评测标准应该是什么样的?
熊德意:评测标准是非常有必要的。大模型评测主要有两个维度,一个是综合能力,即完成任务的能力达到什么水平。大模型是通用人工智能,通用就是综合性、多任务性,因此,需要建立多维度、多基准、全面、综合的评测标准。
另一个维度是对齐,或者说安全。大模型是一把双刃剑。用得好,可以造福社会和人类,用得不好,将带来安全隐患和风险,远的安全担忧是随着机器智能水平的不断提升,机器是否还按照人类赋予的目标行事,国际上很多研究机构和AI专家,对通用人工智能发展一直持谨慎态度,包括OpenAI。
近的安全担忧主要是大模型带来的社会伦理风险。比如,目前的大模型具有幻觉,就是一本正经地胡说八道。举个例子,曾有一名美国律师使用ChatGPT辅助写诉状,结果ChatGPT杜撰了多个完全不存在的案例。
另外一个重要的伦理风险是对大模型的滥用。大模型拥有大量知识,包括很多涉险、敏感知识,一旦被居心不良的人使用,可能带来安全隐患,如研制生化武器、进行网络攻击等。
为了防止大模型出现短期的社会伦理风险及未来不可控的安全担忧,需要对大模型进行全面深入的评测,监控大模型的能力发展,以便在出现风险之前能够及时发出安全警示。评测是大模型落地前非常重要的环节,国际学术和产业界也普遍认为,需要在技术评测的基础上对大模型实施安全审查。
红星资本局:国内现在有没有机构和标准去评测?
熊德意:现在国家有多个部门和组织在做大模型的相关标准。这次要举办的人工智能大模型基准测试科创发展大会,就是依托相关的标准,对国内大模型进行综合评测。国际上,像英国、美国,已经开始筹备建立高级别的人工智能安全研究机构。今年11月初在英国举行的首届全球人工智能安全峰会,中方代表团应邀参加,联合签署了AI安全《布莱奇利宣言》。实际上,我们在今年10月份举办的第三届“一带一路”国际合作高峰论坛上,率先发布了《全球人工智能治理倡议》,比英国这个峰会还早,中方代表团在英国峰会上积极宣介了中方提出的《全球人工智能治理倡议》。
人工智能的治理问题非常重要,上面提到的很多安全隐患,需要全球联合起来共同治理,以共建安全和谐的人类命运共同体。
红星新闻记者吴丹若
猜你喜欢
太原炒股配资 ,创业板公司业绩快报抢先看
专业股票配资平台,为你提供全方位支持
推荐配资股票 ,深交所:暂停战略投资者在承诺的持有期限内出借获配股票
美元指数跌至逾四个月低点10172
探寻线上股票配资门户的独特魅力
广西配资炒股 ,主力资金动向 2163亿元潜入传媒业
10月20日美股成交额前20:出口禁令使英伟达连跌4日,本周下跌9%
,又一国家级“小巨人”申请直联审核!二次挂牌新三板频现
配资炒股是什么 ,主力复盘:超14亿封板中兴通讯 近4亿流出克来机电
AI大模型专家访谈丨天津大学智能与计算学部熊德意:国内更需关注底层技术的研发,为全栈自主能力准备
11月17日沪深两市涨停分析:西陇科学录得8天7板 银宝山新、三柏硕双双晋级6连板,天津股票配资
,【美股盘前】三大期指窄幅整理;苹果据称已售出超20万台Vision Pro;特斯拉Model Y去年蝉联加州最畅销车型
在线炒股配资选择配资:为您提供多种选择
专业股票配资平台,为你提供全方位支持
避险!小摩推荐防御策略:卖美股、买黄金、持有现金
AI大模型专家访谈丨天津大学智能与计算学部熊德意:国内更需关注底层技术的研发,为全栈自主能力准备
中国十大股票配资公司 ,3月1日龙虎榜:595亿抢筹浪潮信息 机构净买入4只股
,又一国家级“小巨人”申请直联审核!二次挂牌新三板频现
张家港股票配资,2023中国民营企业500强名单公布,上海18家民营企业上榜
微信股票配资 ,中字头个股午后再度活跃 中国石油午后涨超5%
配资炒股是什么 ,主力复盘:超14亿封板中兴通讯 近4亿流出克来机电
全面解析!股票配资基本知识探秘,炒股新手首选
短线高手必备,短线配资网站实用工具推介
香港恒指期货配资 ,【风口研报】55G发展持续提速 设施到应用全产业链迎投资机会
期货配资网站大全:了解各类期货杠杆交易平台
微信股票配资 ,中字头个股午后再度活跃 中国石油午后涨超5%
低息炒股配资门户:低息利率和投资成本考量
场内股票配资,灵活应对市场波动。
专业的股票配资平台 ,高位回落,短期压力加大
,又一国家级“小巨人”申请直联审核!二次挂牌新三板频现