新质生产力在中国丨人才+算力+大模型……北京打造人工智能产业高地

发布时间:2024-10-30 23:26:19 来源: sp20241030

  在刚刚结束的全国两会中,新质生产力成为大家关注的热词。所以究竟什么是新质生产力?

  概括地说,新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。特点是创新,关键在质优,本质是先进生产力。

  科技创新是发展新质生产力的核心要素,当下中国的新质生产力有怎样的生态和发展路径?如何让新质生产力因地制宜、蓬勃发展?来看分布在我国东西南北中的六大科技创新中心如何集聚创新资源、搭建服务平台、打通产业堵点,成为中国新质生产力的策源地和孵化器。

  我国“3+3”科创中心布局已经基本形成

  党的二十大报告提出:统筹推进国际科技创新中心、区域科技创新中心建设。

  科技创新中心具体怎么理解呢?概括来说,就是在全球或某一个国家之内,在科学研究、技术开发和产业创新等方面占据领导和支配地位的城市或城市群,它们的创新资源密集、创新成果丰富,科技要素在战略性新兴产业或未来产业发展中能发挥关键作用,是科学中心、技术中心和产业中心的融合。

  从2016年开始到2022年,国家先后批复了北京、上海、粤港澳大湾区、成渝、武汉、西安等六个科技创新中心的建设方案。截至目前,我国“3+3”科技创新中心的总体布局已经基本形成,在空间上由东部发达地区向中西部全面部署推进,北京、上海、粤港澳大湾区三大国际科技创新中心及成渝、武汉、西安三个具有全国影响力科技创新中心的建设正在稳步推进。

  北京:打造人工智能产业高地

  北京国际科创中心拥有众多国家实验室、国家科研机构、高水平研究型大学和科技领军企业,研发投入和科技创新成果数量质量上都居于全国首位,在脑科学研究、量子科技、人工智能模型开发等领域,不断产生国际领先成果,在理论物理、生命科学、数学等领域也获得了一些国际重大奖项。目前在北京,中关村、昌平、怀柔三个新的国家实验室正在加速建设。

  这里是北京,正在建设国际科技创新中心。人工智能产业是北京的主导产业之一。2023年,北京人工智能产业核心产值有望突破2500亿元,辐射产值规模超万亿元,成为全国人工智能发展的领头羊。北京拥有人工智能领域6个全国重点实验室,以及视频与视觉技术、深度学习技术及应用等3个国家工程研究中心,形成集基础研究、人才培养、高层次学术交流等功能于一体的高水平科研基地。北京人工智能相关企业数量约2200家,全国40%人工智能企业聚集于此。2023年,人工智能领域融资总额约223亿元,约占全国四分之一。

  探访大模型研究机构 走进北京智源研究院

  从2022年人工智能领域开始火爆的语言大模型ChatGPT,到今年年初出现的视频生成大模型Sora,“大模型”,无疑成为当下科技行业的一个热门词语。北京在大模型领域的研发工作进展如何?2018年,在科技部和北京市的支持下,联合多家北京人工智能领域优势单位共建的新型研究机构,北京智源人工智能研究院成立。他们这些年有哪些成果,正在研究哪些项目,未来有何规划?

  在一个实验室内,研究人员正在利用大模型技术将语意分析、视觉识别及动作抓取等多模态任务集中于一个机器狗平台,进行测试训练。而在另外一个实验室,科研人员则利用大模型,训练生成图片、视频等。

  北京智源研究院研究员 王鑫龙:多模态大模型就是希望它也跟我们人一样去接触到各种模态,同时能够创造出新的文本、新的图像、新的视频和音频。

  从2022年人工智能领域开始火爆的大语言模型ChatGPT,到今年年初出现的视频生成大模型Sora,“大模型”,无疑成为科技行业的一个热门词语。而这一技术革新的源起,来自2018年谷歌发布的一篇名为BERT的论文。BERT模型刷新了自然语言处理的11项纪录,可以在多个任务的海量未标注数据上学习,执行知识问答、上下文填空、文本理解等多种语言任务,这一技术开启了一个新的人工智能范式,给当时刚刚成立的北京智源研究院的创始团队带来了全新的启发。

  经过周密分析与筹备,2020年10月,智源研究院将研究方向确定为人工智能的新机遇——大模型,很快聚集了由各学科大学教授、博士、研究生为主组成的100人顶尖科研力量,仅花了5个月的时间,就训练发布了我国第一个中文语言大模型,取名为“悟道”。随后三个月,悟道2.0发布,1.75万亿参数,是当时世界最大的人工智能大模型。

  就在智源研究院投入大模型研究的同时,美国OpenAI发布了参数量更大的大模型ChatGPT,在更大规模的训练中,大模型表现出了更强大的智能涌现,更加印证了一个新的智能时代的到来。北京智源研究院作为新型研发机构,早布局、早投入,让我国在大模型时代中快速迭代,积累了大量技术和产业人才。2021年,他们开始牵头国家立项的新一代人工智能研发,瞄准打造一个开源开放的人工智能大模型体系。

  北京智源研究院理事长 黄铁军:我们一个新的使命就是在这样的一个快速发展的状态下,我们作为这么一个机构能不能为这个产业的发展提供一个开源开放的技术体系,把大家的创新力量发挥出来。这套体制就是它是一个所有的代码都是完全开放的,我们的使命就是要推动这个领域的发展。

  新型研发机构怎么新?探访北京通研院

  截至目前,已经有七八个大模型产业转化项目从智源院的早期团队中发展出去,成立了相关公司,初步完成了项目转化。

  前沿技术的探索具有不确定性,大模型的爆发也是技术迭代中发生的偶然。为了能始终处于全球人工智能研究领域的第一梯队,北京充分发挥科研资源和人才优势,在人工智能领域围绕大模型、通用智能体、科学智能等不同路径,积极布局人工智能领域新型研发机构。那么这个领域的新型研发机构怎么新?现在正在研发什么?

  走入北京通用智能研究院,就仿佛走入一个人工智能训练基地。他们正在打造一个由“价值驱动”而非“数据驱动”的通用智能体。它的名字叫“通通”,可以存在于虚拟世界,也可以与机器人结合,让机器人拥有价值判断能力。在后台,我们可以调整“通通”的价值维度,比如让她做一个爱干净的小朋友。

  北京通用人工智能研究院先进技术中心副主任 陈浩:它可以通过多模态交互,通过自己的探索和人之间的互动,能够增量地去学习到一些新的知识和价值,那么它的难度首先它需要具备非常强大的视觉、语言、理解、推理、归纳、总结这样的一些能力。在这些能力的基础上,她才有可能发展出更高阶的实时在线学习的能力。

  大模型技术虽然能够涌现智能,但是对算力的消耗也是巨大的,通研院的技术团队希望探索一条由价值驱动的通用智能体,可以消耗尽可能低的算力,实现智能。

  技术路线上独辟蹊径,科研组织形式上也在跨界探索。这是一个名为“眉飞色舞”的机器人,实现这样一个技术效果,团队跨界了多媒体、机器学习、心理学等多个学科。

  北京通用人工智能研究院前沿研究中心主任郑子隆:机器人包括认知、推理,然后心理学等,非常交叉的一个复合型人才。然后我们的整个研究中心是有七个实验室,包括了计算机视觉、自然语言机器人等,是一个非常复合型的人才培养体系。

  2023年全球顶级科技创新集群北京排名第四

  创新的基础是人才。数据显示,北京人工智能领域核心技术人才超4万人,占全国的60%。北京共有9所高校设立了人工智能学院或者研究院,占全国20%。北京正在打造人工智能产业高地,计划形成一个完整产业生态。

  分两个角度来看,算力方面,北京已部署智能算力超过10000P,有效支撑大模型研发迭代。这个大家可能没有概念,专家给我们介绍,1000P的算力,就相当于50万台PC电脑,举个例子,以对20万颗星体的数据探索来说,如果用传统方式,大概需要一个有经验的科学家用169天才能完成,而现在只需要10.02秒。

  而数据方面,开放首批“中文互联网语料库”,建设国内首个国家数据基础制度先行区。

  此外,在世界知识产权组织发布的《2023年全球创新指数》中,全球顶级科技创新集群的排名,北京排在全球第四。在这个排名体系里,科技集群的概念被解释为“科技枢纽”,指的是世界上发明家和科学作者最多的地区。可以说,从这个排名中也能感受到北京国际科创中心的实力。

  专家分析:北京国际科创中心有何优势特点?

  《北京国际科技创新中心建设条例》3月起施行

  今年3月1日,《北京国际科技创新中心建设条例》开始施行,明确了国际科技创新中心建设领导体制,充分发挥北京科技资源优势,形成强大工作合力。明确国际科技创新中心的战略规划和建设布局,为未来建设发展提供重要遵循。我们也期待着北京国际科创中心能为中国乃至全球贡献更多创新研发成果。

【编辑:刘阳禾】