AI for Science推动科研范式革新:创新知识服务视角下的“平台科研”范式
毛进 1,2, 周凡倩 1, 王卓昊 3
1.武汉大学信息管理学院,武汉 430072
2.武汉大学信息资源研究中心,武汉 430072
3.中国科学技术信息研究所,北京 100038
摘要
立足科技情报知识服务视角,梳理AI for Science(AI4S)推动的“平台科研”范式内涵与框架。根据库恩范式理论论述了AI4S推动科研范式革新的必然性,采用培根归纳法总结的科学研究流程作为框架线索,阐明创新知识服务与“平台科研”范式的互促共进关系并作为理论指导。创新知识服务视角下的“平台科研”范式以服务科研创新活动为宗旨,主要内容包括知识表示视角下的科学数据管理、知识融合视角下的通用知识库构建、知识推理视角下的科学假设预测、知识发现视角下的科学实验执行和知识应用视角下的工业赋能。本文提出了一种创新知识服务视角下的“平台科研”范式框架,旨在从创新知识服务角度理解“平台科研”范式,厘清各主要环节创新知识服务的核心研究内容,以期成为科技情报研究领域的新兴知识生长点,为我国抢抓AI4S科研范式革新机遇提供参考思路。
关键词
AI for Science; 创新知识服务; 科研范式; 平台科研
引用格式:
毛进, 周凡倩, 王卓昊. AI for Science推动科研范式革新:创新知识服务视角下的“平台科研”范式[J]. 情报学报, 2025, 44(2): 132-142.

👈识别文章二维码查看全文
0
引言
近年来,数智时代的高速跃迁正不断重塑甚至颠覆社会各行各业的思维范式,人工智能(artificial intelligence,AI)无疑是其中最具代表性的创新技术之一。AlphaGo、AlphaFold和ChatGPT等AI成果接连问世,无不引发社会各界的高度关注与讨论,关于“AI+”的畅想接踵而至,与高新技术发展协同共生的科学研究领域被热议将成为AI最理想应用场景之一,“AI for Science”(AI4S)概念应运而生。鄂维南院士在2023科学智能峰会上指出,AI4S正在推动新一轮科研革命[1]。在人工智能兴起之际,世界各国已接连出台相关政策举措。我国为抢抓人工智能发展的重大战略机遇,于2017年印发了《新一代人工智能发展规划》(以下简称《规划》)[2]。为进一步落实《规划》,科技部在2022年正式启动实施科技创新2030——“新一代人工智能”重大项目,鼓励各界学者攻关前沿课题[3]。在科研领域,科技部联合自然科学基金委启动了“人工智能驱动的科学研究”(AI for Science)专项部署工作[4],宣告“第五次科研革命”[5]的全面到来。在此背景下,科技情报研究领域愈加关注AI掀起的情报研究和工作变革,并思考如何利用AI赋能和服务科研创新活动过程。
2023年,北京科学智能研究院发布的《科学智能(AI4S)全球发展观察与展望》首次提出了“平台模式”科研范式的概念,归纳总结了AI4S的核心组成要素和赋能路径,提出了“四梁N柱”的框架设想[1]。在此基础上,本文尝试从创新知识服务视角出发,以科研创新活动过程为主线,建构更为系统、完善的AI4S驱动下的“平台科研”范式框架,为科技情报领域指明新的研究方向和挑战,即为科研创新活动全过程提供全方位的创新知识服务。
有鉴于此,本文首先明确AI4S的定义、内涵和发展动向,并通过第四范式理论、库恩范式理论和培根归纳法等经典理论方法,总结传统科研范式的主要矛盾,并据此论述AI4S推动科研范式革新的必然性;其次,梳理“平台科研”范式的内涵与需求,辨析其与创新知识服务间的互促共进关系;最后,站在创新知识服务研究视角,以科研创新活动过程为线索,提出一种“平台科研”范式框架,并梳理其涵盖五大阶段的具体内容及实现路径,以期为我国抢占人工智能助力前沿科研赛道提供情报理论支撑。
1
AI for Science (AI4S)
1.1 AI4S定义与内涵
在人类科学发展历程中,科学发现与技术发展始终作为相互依存、促进的辩证统一体而存在,科学研究范式的更迭与技术背景的革新相辅相成。2011年,图灵奖得主吉姆·格雷等曾依据时代技术背景,将科研发展进程归纳为3种范式,并提出基于海量科研数据的“数据密集型科学发现”范式,即“第四范式”[5]。科研范式发展进程如图1所示。自第四科研范式概念提出以来,AI等颠覆性技术涌现,传统科研模式与高新技术水平间的矛盾日益明显,“维度灾难”正阻碍科学家从更广泛的空间、时间高维尺度上理解自然现象,推进自然科学[6],科研革命即将迎来以AI for Science为核心驱动的“第五范式”。

图1 科学范式发展进程
AI4S是AI技术与科学研究深度融合的产物。广义上,AI4S是指将AI技术应用于各学科科研流程、技术创新和成果转化等广泛场景;狭义上,AI4S是指利用AI技术学习与预测自然界和人类社会中的规律,推动科学发现和创新的过程[4]。2022年,汤超院士在首届科学智能峰会上指出,Al4S必将在推动科学与技术的进步、促进经济发展、提高人们生活水平等方面发挥重要作用[7]。
1.2 AI4S研究现状
AI4S的发展已从愿景成为共识,各国政府、高校与科研机构等正开展AI4S的深入布局,并已在解决各学科热点、难点问题上取得进展。基于学科特性与研究范式,目前AI4S相关研究主要集中于生物医学、材料学、化学和物理学等领域,其核心赋能逻辑是借助“数据、模型、算法、算力”,通过数据驱动、模型驱动以及模型驱动与数据融合方法的深度结合赋能上述领域科技问题的高效求解。
在生物医学领域,AI技术主要应用于蛋白质科学、基因治疗和靶标发现等研究问题中。DeepMind发布的AlphaFold2通过学习现有氨基酸序列实现蛋白质3D结构高精度自动预测,给药物设计与生物结构相关领域带来根本性改变[8]。MIT与Harvard等研究团队开发的P-NET(pathway-aware multi-layered hierarchical network)模型可自动预测前列腺癌症状态、评估靶向治疗状况,为癌症预测与发现提供了新思路[9]。在材料学领域,高通量计算与AI技术可以大幅提升依靠试错、枚举的传统材料发现效率。美国科学家使用“失败”实验数据训练机器学习算法来辅助预测材料发现,算法准确率达到89%,显著优于人工预测的准确率78%[10]。波兰学者优化算法,使得Chematica化学软件能自动设计出与人工设计几乎无异的复杂天然材料产物全合成路线[11]。在物理学领域,量子力学、粒子物理等研究分支均在AI技术的参与下取得重要成果。欧洲核子研究组织的科学家证明了质子内部极有可能存在5个夸克[12],物理学家Christine Aidala称机器学习方法是研究关键,它可以生成更加全面的假设,从而减少数据分析偏差[13]。
在上述基础学科领域,AI4S相关研究聚焦于借助AI技术解决具体的科技问题,实现科学发现的突破。相比之下,科技情报研究领域则主要以科学研究活动本身作为研究对象,关注AI4S对科学研究活动的影响,具体包括3个方面。首先,探究AI技术以及AI4S驱动的科研范式如何影响学科本身的发展动向;其次,借助学科特色思维与方法剖析AI技术对于前沿基础研究的影响;最后,构思并提出面向AI4S的科技情报助力路径。在AI技术涌现初期,相关研究主要探讨通过“AI+”实现知识服务智能化的思路,有学者针对开放科学环境与人工智能时代背景下知识服务存在的发展困境,梳理了AI技术破解知识服务发展困境的逻辑机理,并提出了知识服务智能化的总体架构及驱动机制[14];有学者从科技情报服务视角,阐述了科研智能化的发展现状、内涵特征及其实现过程及特点,列举了在AI驱动的科研智能化背景下知识服务变革方向等[15];亦有学者从智能机器人的具体视角出发,探究科研智能化视域下融合智能机器人的知识服务内涵过程和典型模式[16]。随着人工智能技术应用范围的进一步普及,领域内学者开始拓宽研究视野,旨在运用科技情报思维体系来预测AI4S的影响。例如,以ChatGPT为代表性研究对象,基于应用牵引、原理驱动和创新主体迁移3个视角,讨论AI技术革命对基础科学研究带来的影响及对我国的发展建议等[17]。现如今,前沿技术与现存科研范式矛盾愈加明显,部分研究开始以数智赋能科研创新为立足点,提出了基于数智技术的科研创新辅助框架,通过AI技术提升文献检索、学术阅读、论文写作等信息服务和知识服务,从而加快科学研究创新活动[18]。相应地,学者们相继提出AI4S驱动的智能科学[19]、面向科技信息创新的智能科学家[20]以及科研智能化[21]等全新科研概念或框架,为全新科研范式提供了理论构想。如何突破传统科研模式带来的平台、资源设施、学科壁垒以及思维模式等限制,通过嵌入于科技创新活动过程的创新知识服务构建面向AI4S的全新科研范式,推动科学界的整体进步与科学发现的进程,是科技情报领域当前思考的一个重要方向。
1.3 AI4S推动科研范式革新的必然性
库恩范式理论认为,“范式”就是能够代表某个科学发展阶段的公认模式[22],并指出了科学革命与范式转换的伴生关系,即科学革命是一种新旧范式更替的变革,当传统科研范式存在严重矛盾或解释力不足时,会激发科学界的变革和转型;单纯的技术进步或少数学科的突进并不代表整体性科学跃迁,只有完成彻底的科研范式转换,才能完成科学革命。现如今,AI4S正在推动新一轮科学革命:完成科学研究从“小农作坊”范式向“平台科研”范式的转换[1]。“小农作坊”范式是指人力成本高、科研技术落后、学科视野狭窄以及成果落地困难的传统低效科研范式,其本质上是数据密集型“第四范式”的发展瓶颈状态。在“小农作坊”范式下,科研团队规模较小且相互孤立,团队之间缺少数据共享机制,阻碍了数据密集型科研和AI驱动科学研究的发展。基于库恩范式理论,本文结合科学研究和科技创新的关键因素,梳理了传统“小农作坊”范式与科研创新发展趋势间存在的主要严重矛盾,论证科研范式革新的必然性。
第一,数据资源与数据管理能力间的矛盾。主要体现在科研数据采集、数据处理与表示以及数据存储3个阶段。首先,原始科研数据具备多源异构等特点[23],缺少通用的数据采集规则与工具,这导致科研人员将大量时间耗费在简单机械又耗时繁重的采集任务上;其次,现有条件难以满足科学实验中超大型数据处理任务对计算能力、内存空间及推理能力的要求;最后,目前科研数据存储仍以传统的中心式数据库为主,缺乏统一的存储标准与共享平台,各团队数据难以互通、复用[24]。
第二,学科视野与复杂现象间的矛盾。主要体现在科学假设生成与交叉学科思想两方面。首先,科学发现源于科学假设,在传统科研范式中,科学假设的形成往往依靠科研人员主观经验、大量试错等方法[15],会产生难以避免的主观偏见;其次,复杂现象往往属于多维交叉学科问题,仅靠科学家团队难以解释多学科背景下的多维复杂现象[25],这会造成思维限制、假设片面、学科壁垒等问题。
第三,科学实验与技术手段间的矛盾。在传统科研模式中,需要人工完成实验全流程,不仅实验手段效率低,所能提供的实验信息也有限;同时,缺乏规范的实验数据自动记录工具,导致数据遗失、数据难以复用等问题屡见不鲜。
第四,科研成果与产业赋能间的矛盾。科研成果转化是科研的最终目标,而传统科研常处于闭门造车的窘境,忽略了科研落地的“最后一公里”[26],这会造成产研创融合体系不健全、制造业创新薄弱等问题。
综上,AI4S推动的技术革新与传统的“小农作坊”科研范式在数据管理、科学问题、科学实验与成果落地等环节中体现出日益严重的矛盾。根据库恩范式理论,上述不可解释与调和的矛盾必将推动科学界萌发新旧科研范式的变革,最终完成由现行传统科研范式向全新“平台科研”范式转换的过程。
2
“平台科研”范式
2.1 “平台科研”范式内涵、需求与特征
平台模式是一种通用的一体化基础设施架构,可用于实现多主体、多流程、多数据源任务之间的互联、集成和协作。AI4S驱动的“平台科研”范式实质上是平台模式在科研领域的应用,“平台科研”范式的内涵是实现以AI技术为核心的多主体、多流程、多数据源的集成协作智能化科研过程。
培根归纳法指出,通过全面搜集、观察和比较分析与研究相关的大量资料,能够总结出目标事物的属性或普遍规律[27]。本文应用培根归纳法对前沿科学研究文献、综述文献和相关资料[28]等进行比较分析与总结,最终将平台科研范式所服务的科研活动流程总结为数据采集与管理、科学知识库搭建、科学假设生成、科学实验执行以及知识成果应用5个阶段。目前,鲜有研究与平台科研范式直接挂钩,现有工作主要从两个视角出发:一是收缩研究视野,围绕某一特定科研领域展开;二是缩短研究链条,对某一具体科研流程阶段进行深入研究。从收缩研究视野的视角来看,四川大学建立了从基础研究等到临床应用的产学研医一体化科研平台,获Nature官网报道[29];有学者构建了大数据驱动的海洋人工智能科研服务平台,为科研人员提供“一站式”服务[30]。从缩短研究链条的视角来看,相关研究主要以知识服务流程表征科学研究具体环节。例如,从知识发现的角度出发,通过知识图谱搭建智能语义搜索和多维知识集成检索平台[31];从知识生成的角度出发,探讨AIGC(artificial intelligence generated content)发展背景下平台化知识生成的路径[32]等。
结合前文归纳的“小农作坊”科研范式面临的矛盾以及平台科研范式相关现有研究的局限,本文对平台科研范式的需求与特征进行如下提炼。
第一,构建“通用性”平台,解决学科共性问题。平台科研范式框架需满足多学科领域科研创新活动的通用需求,构建新一代AI技术参与下的通用一体化科研基础设施平台,解决各学科间共有的科研问题。
第二,打造“智能化”流程,覆盖科研闭环链条。平台科研范式框架需在AI技术的参与下覆盖科研创新活动全流程,以“数据采集与管理—科学知识库搭建—科学假设生成—科学实验执行—知识成果应用”科研链条作为框架内容串联依据,实现科研创新活动全流程智能化。
第三,AI“创新性”助力,破解现有矛盾难题。平台科研范式框架各组成内容在AI技术的加持下,有针对性地解决现有科研范式下数据资源与数据管理能力间的矛盾、学科视野与复杂现象间的矛盾、科学实验与技术手段间的矛盾和科研成果与产业赋能间的矛盾,只有解决现有矛盾才能彻底完成科研范式的转换。
综上所述,与传统落后的“小农作坊”科研范式相比较,“平台科研”范式的明显特征是“通用性”“智能化”和“创新性”,建立起不同科研团队之间的数据知识共享和科研创新活动协同关系。以科研创新活动流程为基准,进一步梳理科研创新活动流程所对应的“平台科研”范式环节主要内容与优势,如图2所示。

图2 “平台科研”范式与科研创新活动流程
实际上,目前已有大量前沿AI4S研究正遵从上述范式内容,从侧面验证了该设想的可行性。例如,AI化学机器人“RoboChem”[33],在智能化收集、分析与管理光催化反应实验数据的基础上构建了跨学科通用结构化知识库,支持有效捕捉不同光催化反应变量之间的复杂相互依赖关系,以识别最优反应条件并执行验证实验,为光催化工业应用提供了可靠的优化方法,遵循平台科研范式主旨。
2.2 “平台科研”范式与创新知识服务
DIKW(data, information, knowledge, wisdom)结构理论指出,知识是海量数据精炼而来的产物[34]。广义上的知识服务,是指面向用户的知识学习问题,向用户提供知识信息、知识处理手段及问题解决方案的服务过程[35]。从情报学角度出发,本文认为,平台科研范式的关键核心在于提供深度服务于科研创新活动的创新知识服务。在AI4S场景下,创新知识服务是使用AI技术对科学知识资源进行知识抽取、融合、推理、发现等处理,辅助科研人员高效完成科研创新研究流程,最终生成科学问题解决与应用方案的自动化、智能化、智慧化的服务过程[21]。
创新知识服务视角下的“平台科研”范式基础框架如图3所示。AI4S推动传统科研的“小农作坊”模式向“平台科研”范式转变的核心目的,是逾越传统科研的低下效率与高新技术的飞速迭代间的鸿沟,提高科研效率的本质就是提升科学知识流转能力[36]。服务于科研创新活动的创新知识服务主要涵盖知识抽取、融合、推理、发现和应用五大知识流转路径,与平台科研范式要求中的科研基础设施内容一一对应,这将为平台科研范式内容框架提供系统性、全流程化的理论指导。与此同时,平台科研范式也将推动创新知识服务领域发展革新:首先是技术手段革新,AI技术将参与科学知识流转,加速知识服务手段从传统冗杂的人力驱动转向高效、简洁的数智驱动;其次是科研产出成果将持续更新科学知识资源;最后,平台科研范式的应用将助力创新知识服务领域成果落地。

图3 创新知识服务视角下的“平台科研”范式基础框架
3
创新知识服务视角下的“平台科研”范式框架
本文从创新知识服务视角来理解和构建“平台科研”范式框架,将知识表示、知识融合、知识推理、知识发现和知识应用的创新知识服务流程,映射到科学数据管理、通用知识库构建、科学假设预测、科学实验执行和工业赋能等平台科研中的五大通用环节,形成通用性、智能化和创新性的科研基础设施,从而构建创新知识服务视角下的“平台科研”范式基础框架。
3.1 知识表示视角下的科学数据管理
科学知识表示是指进一步解释科学知识客体的内涵,或按照一定原则将其属性、关联等表示为特定科学知识结构的过程。科学研究数据来源于科学文献、专利数据、科学实验数据、社会调查统计数据和政府开放数据等[37],具有多类型、复杂结构、高速迭代和价值偏差等特点。从“密集型科研”第四范式开始,科学发现就已建立在海量数据基础之上,如何从中精准获取符合研究背景的信息成为进一步提高科研效率的前提。平台科研范式要求对海量科学数据进行有序化、集成化、智慧化的安全管理,科学知识表示视角下的科学数据管理框架如图4所示,将实现以下两个主要功能。

图4 科学知识表示视角下的科学数据管理
(1)数据存储与检索。在“第四科研范式”时期,云存储取代传统集中式存储模式,成为了密集数据科研的支撑底座,但也已疲于应对AI背景带来的大容量、多场景、高性能、集群流动等存储需求;分布式存储平台将成为高精尖领域数据存储的新趋势,并为高效检索提供性能支撑。智能科研数据检索将科研人员提供的科研问题作为提示,自动查询获取多源异构科研数据,并进行学科延伸、增强搜索、数据关联与甄别等处理[21]。通过调研用户的数据需求,还可搭建供给型数据、感知型数据等类型架构,旨在提供科技智慧数据服务[38]。
(2)科学知识抽取与表示。具体研究背景下的原始科研数据集可能来源于多渠道,包括文字、图表、语音及视频等形式。部分AI4S前沿科学研究知识抽取与表示示例如表1所示。

由表1可知,知识抽取的目的是从非结构或半结构化数据中抽取具有可用价值的结构化知识元,完成数据资源向知识资源的转变;相比于传统的知识抽取任务,从多源异构数据中抽取有效知识元需要进行数据融合处理,主要涉及数据滤重、消歧、加权以及字段映射、补全等[42]。面向AI4S研究的知识表示主要有两种表示形式,其一是可读知识,即将知识元直接转化为计算机可读形式,并作为机器学习等模型的输入;其二是关联知识,将知识元进行实体、关系与属性关联,形成可支持进一步推理的知识模型,为后续知识库搭建提供基础。除此之外,还可结合使用场景完成知识抽象与具象两种表达形式的相互转换,即知识的数据化与数据的知识化。
3.2 知识融合视角下的通用知识库构建
知识融合强调解决大规模知识共享、组织和利用等问题[43],知识库是实现知识融合的重要载体。按照知识属别,知识库可分为领域知识库与通用知识库两类。前者是面向精细化、专业化知识构建的结构化程度较高的知识库,其广泛应用已大幅度提升了知识利用效率。然而,随着研究的逐步深入,传统科研范式正面临着两个新的知识融合挑战。
第一个知识融合挑战是多学科知识融合。目前,学界仍待探索的实际问题或自然现象常常具有复杂的跨学科背景。有学者从计量学角度出发,发现期刊论文参考和施引文献的学科多样性都在增长,即科研学科交叉性正在增长[44]。因此,仅仅依靠科研人员的知识储备与领域知识库的支撑,难以快速打破学科壁垒,实现进一步的知识发现。
第二个知识融合挑战是多学科融合的通用知识库的高效利用。知识融合流程的终端是知识利用,一方面,要从大规模知识库中快速检索筛选到与具体研究问题相关的知识,需要配套高技术要求自动化推理与决策途径;另一方面,知识库本身并不能保证跨学科科研人员对陌生领域强专业性知识的准确理解,需要对领域专业知识做进一步加工解密与呈现。
面向多学科的通用知识库是平台科研范式的科学资源底座,AI技术可助力通用知识库实现量级跨越、二次表达和自适应转化等规模与功能方面的提升。知识融合视角下的通用知识库构建途径如图5所示。

图5 知识融合视角下的通用知识库构建
首先,多学科通用知识库的地基是领域知识库的自动构建与充分完善。原始数据包括科技文献、专利数据、科学实验数据等,科学数据管理平台为领域知识库构建提供数据处理支撑,主要任务包括实体抽取、关系抽取、主体抽取和本体构建等。其次,在以各学科领域知识库为数据来源的基础上,知识融合为多学科通用知识库的构建提供实体消歧和实体对齐两大方法支撑,分别解决一词多义与同义异名的问题[45];机器学习、深度学习等AI技术为知识融合方法提供了技术支撑,图神经网络、支持向量机等可以有效实现实体消歧;决策树、集成学习和TransE模型等在实体对齐方面表现出色。最后,引入融合多学科通用知识库的大语言模型(large language models,LLMs)以优化知识库成果的利用率。LLMs是当今人工智能领域最为热门的研究方向,已在科学研究领域展现出巨大应用潜能,使用大规模知识库训练模型也将大幅度提升LLMs在特定科学问题中的预测精度与适用范围。构建融合多学科通用知识库的LLMs可实现知识快速检索与筛选、知识关联网络查询、学科专业知识的精加工与再表达、数据与知识的转化互通和科技文本的自动扩充与生成等功能,提高知识库利用深度与转化效率。
3.3 知识推理视角下的科学假设预测
知识推理是根据已有知识预测高置信度知识关联或缺失要素的过程[46]。作为科研创新活动过程的核心环节,提出科学问题的科学假设是科学知识发现的起点。因此,平台科研范式中一项最为重要的创新知识服务内容是科学假设预测。科学假设预测是一种知识推理过程,即在已有科学知识的基础上预测科学问题发展的未来增长方向或生长点。在平台科研范式中,复杂AI模型可用于预测科学假设,包括两个主要子任务:科学假设智能生成与科学假设智能寻优。总体实现路径如图6所示。

图6 知识推理视角下的科学假设预测
科学假设智能生成,是指通过神经网络、增强学习、符号回归等AI模型,从已有数据、知识中自动总结知识模式、组合、规律等,进而提出若干原始科学假设;这种方式可以有效加速科学假设产生进程,并减少人类的主观偏见,打破思维界限,突破维数灾难。各学科领域下的科学假设生成内容如表2所示,在应用研究领域,科学假设生成将主要用于新型材料研发、疾病影响因素预测、新型药物设计等;在理论研究领域,主要借助推理和归纳的算法思想,从自然现象或实验数据中提出全新猜想、未知定理和规律。

科学假设智能寻优是最重要的AI应用场景之一[47]。由表2可知,科学假设智能寻优的目的是借助进化算法、群智能算法等AI优化算法,按照既定的规则或指标,评估原始科学假设置信度并进行筛选。科学假设生成中广泛出现的不同约束下的排列组合排序、不同环境因素的博弈评价等都由智能寻优解决,最终所得科学假说流转入下一环节,进行科学实验验证与知识发现。
3.3 知识发现视角下的科学实验执行
在科学研究过程中,科学知识发现是一个挖掘新颖且具有潜在价值的、经过科学验证的知识的非平凡过程[52]。科学实验是检验科学假说的唯一标准,云端实验室是一个高度自动化的集中实验中心,可自动执行科学实验并完成科学假说验证,从而达到知识发现的最终目的,总体实现路径如图7所示。

图7 科学发现视角下的科学实验执行
首先,实验预处理中心将由科学假设生成的实验方案步骤转换为机器可读代码,随后通过仿真实验室进行实验模拟执行,仿真实验室提供基于云的标准化真实环境,可供多学科实验集成使用。模拟通过后,云端控制中心将联动仿真实验室与真实实验室,提供高度整合的算力平台,由机器人采用高精度、高效率的表征方法,自动执行实验。科研人员可通过云端控制中心远程监控实验室的运转,并实时进行调参与流调等操作。高效、精准是AI云端实验室的最大优势,Nature封面曾刊登由英国科学家研发的AI化学家,可在8天内自动完成一位科学家2~5年才能完成的实验数量[53]。除此之外,实验元数据将被自动通过文件传输协议、远程登录工具等方法上传到云端自存储,避免了科学实验的“不可重复性危机”。
3.5 知识应用视角下的工业赋能
在科技创新场景下,科技知识应用强调将科学知识成果转化为现实生产力。AI4S科研成果赋能工业数智化转型,实践“工业智造”生产新范式,是打通产学研闭环的“最后一公里”。知识应用视角下的工业智造主要从工业场景需求、工业生产流程和校企源头合作3个环节展开,实现路径如图8所示。

图8 知识应用视角下的工业赋能
(1)工业场景需求:刻画工业场景,把握科研方向。场景工业5G与“AI+工业”正由技术融合走向创新变革。AI4S的创新成果已助力多行业走向智造转型,如生物药学中的靶标药物研发、材料学中的合金纳米材料研发和物理学中的核聚变等离子体控制等。只有符合工业场景需求的科研成果才能实现产业落地,针对工业具体应用场景整理深层次问题与用户需求,有助于集中科研力量攻关难题,AIS4的前沿研究将为工业应用场景转型带来颠覆性创新技术引领。
(2)工业生产流程:规范生产流程,扩大生产规模。要想实现科学成果落地,就必须完成科学实验室到工业量产车间的技术衔接,工业生产流程规范化、工业量产规模扩大化是实现科技成果有效转化的技术底座。工业生产需要面向产品设计、工业开发、制造水准和质量控制等环节制定统一、标准化的规范,保证生产全流程的可溯源、可定位、可重复。实验室中的研发工作以精且少为特点,而产业应用成果以量产、创收为目标,AI技术为同时实现量产与质保提供可能。
(3)校企源头合作:连接源头活水,加强校企合作。高校、研究机构等是科学知识发现的源头,业界企业是引导科研成果由势能转变为动能的活水。目前,部分高校已陆续揭牌校企联合培养实验室,如华中科技大学-华为技术有限公司“数据中心架构创新中心”、上海交通大学-依图医疗联合实验室等;加强产研源头合作还离不开政府牵头,部分科研机构密集型地区已在政府牵引下着手探索产学研创新链条体系,如中关村国家自主创新示范区、武汉东湖新技术开发区等。
4
讨论与展望
本文梳理了AI4S的内涵与发展现状,根据库恩范式理论论述了AI4S推动科研范式革新的必然性;厘清了“平台科研”新范式的内涵、需求与特征,立足于科技情报研究和工作,阐明“平台科研”范式与创新知识服务间的互促共进关系,并据此提出一种创新知识服务视角下的“平台科研”范式框架,以创新知识服务作为理论指导,构建覆盖科研创新活动全流程的通用性、智能化和创新性科研基础设施,旨在为中国抢抓AI4S科研范式革新机遇提供重要的理论指导和实践参考。
在我国迈向科技自立自强的征程中,“平台科研”范式对我国的创新知识服务提出了新的发展目标和要求,其具体应用场景和着力点具体如下。
第一,跨学科协同创新,推动科学交叉融合。通过平台科研范式,促进生物学、化学、物理学和数学等不同前沿基础学科之间的知识融合与协同创新,降低学科专业壁垒,支持跨学科研究项目的创新化设计与管理。
第二,突破认知瓶颈,支持智能假设生成。知识融合推理是知识创新的逻辑关键,平台科研范式下的科学智能假设生成将有效打破研究人员的经验式假设生成模式所造成的科学认知瓶颈,提高颠覆性创新的可能性。
第三,智能助手自动实验,提升科研效率水平。平台科研范式引入智能科研助手,辅助科研人员进行实验设计、数据分析和结果解读,提高科研效率。例如,智能化学家可以自动化执行材料合成操作,实时记录数据并进行初步分析,较手动实验而言,其效率可提升数百倍。
除此之外,“平台科研”新范式还将反哺创新知识服务领域,从技术手段革新、知识资源扩充和研究成果落地3个方面促使知识服务实现创新升级。例如,中国知网、万方数据、维普等国内主流知识服务平台可泛化平台科研范式架构,利用相应智能技术实现知识关联支撑的信息查询与推理、知识组织支撑的文献自动分类与标签化、知识生成支撑的文献摘要-方法-结论自动生成和知识推理支撑的关联主题与研究热点探测挖掘等新兴知识服务,助力我国抢占全球科技创新知识服务领域发展中的领跑地位。
总的来说,AI4S驱动的“平台科研”范式依托于智能化科研平台和工具指导科研主体提升科研效率和创新能力,实现包括科研数据管理、通用知识库搭建、科学假设智能预测、评估以及实验执行的自动化科研通用流程,以突破“小农作坊”传统科研范式下的维度灾难。然而,AI技术在科学界的应用趋势也将带来数据隐私保护、模型黑盒、算法偏见、成果责任主体模糊和科研伦理等挑战,需进一步加强数据治理、提升AI可解释性和透明性以及构建AI伦理审查机制等应对措施,从而确保“平台科研”范式能够安全、合规地落实和普及。后续将继续从科技情报学科立足点出发,结合AI4S发展态势对范式框架中核心内容的体系架构、关键技术与具体实现路径等展开进一步研究。
参考文献
[1] 向着新一轮科学革命制高点攀登——2023科学智能峰会观察[EB/OL]. (2023-08-11)[2023-09-09]. http://www.xinhuanet.com/tech/20230811/209c487c5e6f4bd78a6cb248ab5b79cb/c.html.
[2] 国务院关于印发新一代人工智能发展规划的通知[EB/OL]. (2017-07-08)[2023-10-31]. https://www.gov.cn/gongbao/content/2017/content_5216427.htm.
[3] 科技部关于发布科技创新2030—“新一代人工智能”重大项目2022年度项目申报指南的通知[EB/OL]. (2022-08-12) [2023-10-31]. https://www.ncsti.gov.cn/kcfw/xmsb/202208/t20220816_93841.html.
[4] 科技部启动“人工智能驱动的科学研究”专项部署工作[EB/OL]. (2023-03-27)[2023-10-31].
https://www.gov.cn/xinwen/2023- 03/27/content_5748495.htm.
[5] Tolle K M, Tansley D S W, Hey A J G. The fourth paradigm: data-intensive scientific discovery[J]. Proceedings of the IEEE, 2011, 99(8): 1334-1337.
[6] Zhang X, Wang L M, Helwig J, et al. Artificial intelligence for science in quantum, atomistic, and continuum systems[OL]. (2023-07-17) [2023-08-08]. https://arxiv.org/pdf/2307.08423v3.
[7] 2022科学智能峰会回顾|汤超院士: 关于AI for Science的几层意思[EB/OL]. (2022-08-15) [2025-01-11]. https://cqb.pku.edu.cn/info/1065/1851.htm.
[8] Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589.
[9] Elmarakeby H A, Hwang J, Arafeh R, et al. Biologically informed deep neural network for prostate cancer discovery[J]. Nature, 2021, 598(7880): 348-352.
[10] Raccuglia P, Elbert K C, Adler P D F, et al. Machine-learning-assisted materials discovery using failed experiments[J]. Nature, 2016, 533(7601): 73-76.
[11] Mikulak-Klucznik B, Gołębiowska P, Bayly A A, et al. Computational planning of the synthesis of complex natural products[J]. Nature, 2020, 588(7836): 83-88.
[12] The NNPDF Collaboration. Evidence for intrinsic charm quarks in the proton[J]. Nature, 2022, 608(7923): 483-487.
[13] Wilkins A. Physicists surprised to discover the proton contains a charm quark[EB/OL]. (2022-08-17) [2025-01-11]. https://www.newscientist.com/article/2334076-physicists-surprised-to-discover- the-proton-contains-a-charm-quark/.
[14] 张双志, 李敏, 张龙鹏. 面向开放科学的知识服务智能化: 人机协同视角[J]. 情报杂志, 2022, 41(12): 158-163.
[15] 孙蒙鸽, 黄雨馨, 韩涛, 等. 科研智能化新趋势下知识服务的挑战与机遇[J]. 情报杂志, 2022, 41(6): 173-181, 107.
[16] 李立睿, 张嘉程, 张博睿. 科研智能化视域下融合智能机器人的知识服务研究[J]. 图书与情报, 2023(2): 61-68.
[17] 孙蒙鸽, 韩涛, 王燕鹏, 等. GPT技术变革对基础科学研究的影响分析[J]. 中国科学院院刊, 2023, 38(8): 1212-1224.
[18] 陆伟, 马永强, 刘家伟, 等. 数智赋能的科研创新——基于数智技术的创新辅助框架探析[J]. 情报学报, 2023, 42(9): 1009-1017.
[19] 王飞跃, 缪青海. 人工智能驱动的科学研究新范式: 从AI4S到智能科学[J]. 中国科学院院刊, 2023, 38(4): 536-540.
[20] 罗威, 罗准辰, 雷帅, 等. 智能科学家——科技信息创新引领的下一代科研范式[J]. 情报理论与实践, 2020, 43(1): 1-5, 17.
[21] 孙蒙鸽, 韩涛. 科研智能化与知识服务: 内涵、实现与机遇[J]. 情报理论与实践, 2021, 44(10): 41-49.
[22] 托马斯·库恩. 科学革命的结构[M]. 金吾伦, 胡新和, 译. 北京: 北京大学出版社, 2003.
[23] 秦顺, 戴柏清. 国际科研数据政策导向解析[J]. 图书情报工作, 2022, 66(13): 48-60.
[24] 王庆乐. 基于区块链技术的高校数字图书馆科研数据安全管理策略研究[J]. 图书馆工作与研究, 2021(12): 63-69.
[25] 兰彧, 王祖浩. 科学教育中跨学科理解能力测评的国际经验与启示[J]. 中国考试, 2021(8): 69-78.
[26] 陈劲, 张月遥, 李振东. 科学问题凝练与科研成果落地的贯通机制研究——以国家自然科学基金项目为例[J]. 科学学研究, 2023, 41(9): 1627-1637.
[27] Bacon F. The new organon[M]. Cambridge: Cambridge University Press, 2000.
[28] Wang H C, Fu T F, Du Y Q, et al. Scientific discovery in the age of artificial intelligence[J]. Nature, 2023, 620(7972): 47-60.
[29] Engineering a brilliant body of work[EB/OL]. [2023-10-28]. https://www.nature.com/articles/d42473-019-00073-z.
[30] 王凡, 冯立强, 曹荣强. 大数据驱动的海洋人工智能服务平台设计与应用[J]. 数据与计算发展前沿, 2023, 5(2): 73-85.
[31] 胡吉颖, 谢靖, 钱力, 等. 基于知识图谱的科技大数据知识发现平台建设[J]. 数据分析与知识发现, 2019, 3(1): 55-62.
[32] 全燕, 张入迁. 平台化知识生产的逻辑偏误与AIGC下的建设进路[J]. 南京社会科学, 2023(6): 150-160.
[33] Slattery A, Wen Z H, Tenblad P, et al. Automated self-optimization, intensification, and scale-up of photocatalysis in flow[J]. Science, 2024, 383(6681): eadj1817.
[34] Ackoff R L. From data to wisdom[J]. Journal of Applied Systems Analysis, 1989, 16(1): 3-9.
[35] 孙成江, 吴正荆. 知识、知识管理与网络信息知识服务[J]. 情报资料工作, 2002, 23(4): 10-12.
[36] 科技自立自强之院士说|AI为基础科研带来巨大推动力和全新机遇——访中国科学院院士田中群[EB/OL]. (2023-08-07) [2023-09-11]. http://www.news.cn/fortune/2023-08/07/c_1129790092.htm.
[37] 刘兹恒, 曾丽莹. 我国高校科研数据管理与共享平台调研与比较分析[J]. 情报资料工作, 2017, 38(6): 90-95.
[38] 丁洁兰, 钱力, 常志军, 等. 科技情报智慧数据服务体系建设研究[J]. 情报理论与实践, 2024, 47(1): 30-37.
[39] Xu H, Lin J L, Zhang D X, et al. Retention time prediction for chromatographic enantioseparation by quantile geometry-enhanced graph neural network[J]. Nature Communications, 2023, 14(1): Article No.3095.
[40] Lin W X, Zhao Z H, Zhang X M, et al. PMC-CLIP: contrastive language-image pre-training using biomedical documents[C]// Proceedings of the International Conference on Medical Image Computing and Computer-Assisted Intervention. Cham: Springer, 2023: 525-536.
[41] Segler M H S, Preuss M, Waller M P. Planning chemical syntheses with deep neural networks and symbolic AI[J]. Nature, 2018, 555(7698): 604-610.
[42] 莫君兰, 窦永香, 开庆. 基于多源异构数据的科研团队画像的构建[J]. 情报理论与实践, 2020, 43(9): 100-106.
[43] 卢小宾, 霍帆帆, 王壮, 等. 数智时代的信息分析方法: 数据驱动、知识驱动及融合驱动[J]. 中国图书馆学报, 2024, 50(1): 29-44.
[44] Gates A J, Ke Q, Varol O, et al. Nature’s reach: narrow work has broad impact[J]. Nature, 2019, 575(7781): 32-34.
[45] 朱迪, 张博闻, 程雅琪, 等. 知识赋能的新一代信息系统研究现状、发展与挑战[J]. 软件学报, 2023, 34(10): 4439-4462.
[46] Chen X J, Jia S B, Xiang Y. A review: knowledge reasoning over knowledge graph[J]. Expert Systems with Applications, 2020, 141: 112948.
[47] 徐宗本. 人工智能的10个重大数理基础问题[J]. 中国科学: 信息科学, 2021, 51(12): 1967-1978.
[48] Vasylenko A, Gamon J, Duff B B, et al. Element selection for crystalline inorganic solid discovery guided by unsupervised machine learning of experimentally explored chemistry[J]. Nature Communications, 2021, 12: Article No.5561.
[49] Gómez-Bombarelli R, Wei J N, Duvenaud D, et al. Automatic chemical design using a data-driven continuous representation of molecules[J]. ACS Central Science, 2018, 4(2): 268-276.
[50] Davies A, Veličković P, Buesing L, et al. Advancing mathematics by guiding human intuition with AI[J]. Nature, 2021, 600(7887): 70-74.
[51] Cornelio C, Dash S, Austel V, et al. Combining data and theory for derivable scientific discovery with AI-Descartes[J]. Nature Communications, 2023, 14(1): Article No.1777.
[52] Fayyad U, Piatetsky-Shapiro G, Smyth P. The KDD process for extracting useful knowledge from volumes of data[J]. Communications of the ACM, 1996, 39(11): 27-34.
[53] Burger B, Maffettone P M, Gusev V V, et al. A mobile robotic chemist[J]. Nature, 2020, 583(7815): 237-241.