各省、自治区、直辖市工业和信息化主管部门、通讯治理局以及有关中央企业:
为夯实算力网络发展底座,加快创新技术和产品利用,推动算力网络“点、链、网、面”系统化发展,现组织发展算力强基揭榜行动。有关事项通知如下:
一、揭榜工作内容
面向算力网络的推算、存储、网络、利用、绿色、安全等六大沉点方向,挖掘一批把握关键主题技术、具备较强创新能力的企事业单元,突破一批标志性技术产品和规划。
推算方面,攻关智能算力治理、算力加快等技术,提高推算机能与效能;存储方面,研发多介质存储设备治理、跨域存储资源池协一致技术,实现海量数据靠得住与矫捷存储;网络方面,突破算内网络与算间网络等技术,推进算力资源高速互联;利用方面,加强算力与行业深度融合,实现多场景便捷用算;绿色方面,研发新型造冷、碳排放感知优化等技术,推动算力设施节能降碳;安全方面,推动智能监测、运维机械人等技术发展,保险算力中心靠得住运行。
二、申报和推荐
(一)申报单元须为在中华人民共和国境内注册、拥有独立法人资格、拥有较强技术创新和产业化利用能力的企事业单元。申报单元凭据《算力强基揭榜行动工作榜单》(见附件)选择揭榜工作,并需承诺揭榜后可能在指定期限内实现相应工作,每个单元申报不超过3个项目。有关企业、高校、科研机构等以结合体方式申报的,牵头单元为1家,结合参加单元不超过4家。
(二)各省、自治区、直辖市工业和信息化主管部门、通讯治理局以及有关中央企业依照当局疏导、企业自愿的准则,组织有关单元积极申报揭榜,并作为推荐单元,遵循公开、平正、公正的准则,审核遴选推荐创新能力凸起、产业化远景好、行业带作为用显著的项目,报工业和信息化部(信息通讯发展司)。
三、工作法式和要求
(一)申报单元通过申报系统(https://gs.hcp.ac.cn)进行申报,实现注册后填写申报所需资料。申报截止功夫为2025年3月15日。
(二)各省、自治区、直辖市工业和信息化主管部门、通讯治理局以及有关中央企业作为推荐单元,应于2025年3月31日前登录系统并确认推荐名单(账号密码请通过联系人获。。推荐单元在每个方向推荐项目数量准则上不超过3个,所有方向累计推荐项目总量不超过20个。激励各推荐单元结合现实情况,对推荐项目单元在政策、资金、资源配套等方面加大搀扶力度。
(三)工业和信息化部组织遴选并颁布入围揭榜单元名单。入围揭榜单元实现攻关工作后(名单颁布之日起不超过2年),工业和信息化部委托第三方专业机构发展测评工作,择优确定揭榜优胜单元(每个揭榜方向准则上不超过3家)。工业和信息化部将两全利用各类资源对揭榜入围、优胜单元予以支持,推动优良成就示范利用推广。
四、联系方式
联系人及电话:
工业和信息化部信息通讯发展司010-68206162
技术支持单元:
中国信息通讯钻研院13701380040
工业和信息化部办公厅
2025年2月18日
附件
算力强基揭榜行动工作榜单
一、推算
(一)云边端算网协同治理系统
揭榜工作:面向云边端多层级算力环境,研发算网协同利用治理系统,设计面向分歧利用软件架构的治理机造,支持对分歧架构利用软件的统一治理;研发利用软件在算网协同中的自动化构建部署能力,支持利用软件的自动构建和分发部署;钻研算网协同利用系统的一体化观测能力,降低运维复杂度,提高复杂利用软件运行的不变性和靠得住性。
预期指标:到2026年,研造利用软件治理系统,支持对传统利用软件、云原生利用软件、AI利用软件、大数据利用软件等不少于5种利用软件的全性命周期治理。钻研基于算网协同的散布式构建和部署技术,支持上述利用软件的自动分发和跨算力节点部署,实现零人为染指。研发算网利用一体化观测职能,具备白盒化动态分析以及智能故障根因定位能力。在不少于3个行业实现试点验证。
(二)支持超大规模参数模型的训推一体化异构智算平台
揭榜工作:面向人为智能大模型训练和推理对推算资源的需要,研发支持超大规模参数模型的训练、推理一体化智算平台,蕴含资源调度战术、训推加快套件等,并可支持多
种硬件架构,屏蔽底层硬件差距,提升超大规模模型在训练、推理过程中不变性、资源利用率和运行效能。
预期指标:到2026年,研发一套支持万亿参数模型的超大规模训推一体化智算平台,万卡环境下不变训练功夫不低于30天,有效训练时长不低于95%,训练效能较当前主流水平提升不低于30%,推理效能提升不低于50%。支持主流深度进建框架,兼容多种硬件架构,并提供统一的编程接口和开发环境,实现不低于10个行业用户的落地验证。
(三)异构算力跨域工作编排系统
揭榜工作:针对跨域异构算力协同,研发跨域异构算力治理系统,实现跨域异构算力的治理和利用。研发针对多样性算力的规范化盛开互联职能,支持对分歧类型的异构算力模型统一抽象封装;研发跨域异构算力的治理职能,支持对跨域异构算力的统一治理和协同;钻研跨域多主体算力的安全认证和节造步骤,保险跨域协同安全。
预期指标:到2026年,研发不少于6种跨域协同调度算法,支持数据处置、函数推算、机械进建等不少于3个场景的推算工作部署,实现不少于5个跨域算力中心的统一治理。研发跨域多主体算力的安全认证步骤,支持云边端等分歧层级算力协同的安全要求。在不少于2个行业实现试点验证。
(四)训推算力一体机
揭榜工作:面向人为智能训练、推理场景,研发基于基
础设施即服务(IaaS)和平台即服务(PaaS)的高机能训推一体化解决规划,覆盖对大模型开发训练和部署推理的全流程,蕴含数据筹备、模型训练、模型评测和模型部署。同时,支持大模型加密、攻击防御等能力,解决针对大模型数据泄露、指令攻击等安全问题微风险。
预期指标:到2026年,研发支持至少3种指令集芯片的训推一体机,针对至少5个行业发展人为智能训推一体机利用,为用户提供多元化训推一体化服务,并在至少10种分歧的场景进行人为智能训推一体机落地。
(五)大规模异构算力集群推理加快技术
揭榜工作:研发存储、网络、推算的协同优化技术,通过模型加快、调度加快等步骤实现大规模异构算力集群在大模型推理方面的加快,从而支持更大的模型、更长的高低文、更高的机能及更低的能耗,推进算力芯片在大模型推理方面的更好利用。
预期指标:到2026年,实现集群有效吞吐量5倍以上提升,现实利用场景中可处置的要求数提升1倍以上,首字延长机能提升1倍以上,芯片利用率提升50%以上。通过优化算力中心推算、存储、网络的配比以及拓扑结构和系统调度战术,实现千卡以上异构集群在推理加快领域的突破。
二、存储
(六)磁光电融合存储系统
揭榜工作:针对单一存储介质难以满足多样化数据存储
需要的近况,依附磁、光、电存储在机能、寿命、功耗等方面的差距化个性,将磁、光、电存储技术进行融合,研发磁光电融合存储系统,构建基于固态硬盘(SSD)、机械硬盘(HDD)和光存储的多级存储架构。凭据业务特点,将数据保留在分歧级此外存储设备中,实现海量数据的集钟注统一存储治理,支持算力中心高效、低碳、安全持续发展。
预期指标:到2026年,研发磁、光、电融合存储系统,支持适配散布式文件、散布式块和散布式对象等至少3种存储类型,系统能够凭据数据的接见功夫、接见频率、文件属性等自界说分级战术,凭据业务负载动态调整迁徙。系统可通过介质安全、系统安全、软件安全等夯实底层安全能力,通过防勒索、加密算法、远程监控、光存储预警检测等加强数据安全能力。打造磁光电融合存储利用示范,实现至少20个业务系统利用,实现至少4个东部地域数据流动至西部磁光电存储系统,且数据存储量不少于10PB。
(七)存储调度治理及利用技术
揭榜工作:针对海量数据存储和算力孤岛问题,研发跨域多算的存力调度、存网编排和存算网一体化系统,实现数据的智能冷热分级、利用的跨域无感接见等能力,有效降低成本、提高机能和支持业务。系统具备资源规划、战术调整能力,可优化和调整全网数据存储布局,实现对不休变动的需要的适应。
预期指标:到2026年,研造具备高效、可扩大性的存
储系统,基于智能算法,对数据进行分析和调度,实现利用无感接见和智能流动。钻研存力调度战术,使数据召回率节造在30%以下;钻研基于潮汐网络调度算法,实现网络带宽利用率提升50%以上,达到存网一体的指标。集成存储、推算和网络的能力,支持存算网一体化调度,在算力中心资源池落地利用。
三、网络
(八)高机能数据处置器(DPU)
揭榜工作:发展基于芯粒(Chiplet)和第五代精简指令集(RISC-V)技术的软硬件一体DPU芯片技术钻研,支持算力中心、智算中心、超算中心场景所需的超高带宽和超低时延,突破Chiplet异构芯片封装技术、高速Serdes通讯、大规模无损网络拥塞算法、硬件密码算法、高机能虚构化、硬件可编程等技术,实现基于ARM、X86、RISC-V等异构主题的DPU利用,提升算力中心基础设施处置能力和数据传输能效比。
预期指标:到2026年,实现超高机能DPU芯片研发工作,吞吐能力达到400Gbps,单向流量时延不高于30us,支持与国内表主流CPU、GPU芯片平台的适配,支持主流操作系统兼容,支持数据报文硬件处置逻辑可编程。
(九)基于RoCE的智算网络
揭榜工作:面向RoCE网络发展设备及管控系统研发,通过提高设备带宽、优化负载平衡算法、强化网络流量规划
及运维能力等方式,提升RoCE网络的吞吐量和时延机能。研造新一代智能化管控工具,引入AI大模型能力,简化RoCE网络的部署和配置工作,实现全局、多维度的可视化运维。在网络颠簸、业务调换、故障等情况下,网络参数自动调整,流量急剧切换,从而达到提升网络效能和降低运维成本的指标。
预期指标:到2026年,实现新型RoCE网络整体规划的商用部署,网络机能提升10%以上。通过智能化管控及运维工具,网络部署难度大幅降低,运维效能提升50%以上,可支持更大规模部署和利用。
(十)光互换智算网络技术钻研与验证
揭榜工作:面向智算集群低功耗、高带宽、低延长技术需要,发展智算集群光互换组网关键技术钻研与验证,沉点突破智算集群光互换组网、路由和谈适配等关键技术。针对智算集群的职能、机能、靠得住性和扩大性等要求,钻研光拓扑映射、光电混合路由、多蹊径负载平衡等技术。
预期指标:到2026年,实现支持智算集群的易操作、高靠得住、可滑润过渡升级的光网络,支持人为智能等关键业务承载;光互换设备单端口速度支持100GE/400GE/800GE,互换容量弹性可扩大,可支持不少于3种异构算力资源互联,在不少于2个智算集群实现验证,并实现不少于3种智算业务承载验证。
(十一)面向散布式智算中心的网络关键技术钻研与验
证
揭榜工作:针对智算集群从集中式向散布式部署索求的趋向,攻关算力中心间网络技术,研发面向智算中心间的高靠得住传输设备,构建智算中心间超大容量、超低时延、超高靠得住光电协同网络,实现智算中心高速、靠得住互联。
预期指标:到2026年,突破智算中心间超大容量、超高靠得住网络传输关键技术,研造面向智算中心间网络的传输设备,单波速度不低于1.6Tbps,设备时延不超过30us,支持散布式智算中心间业务的高靠得住传输。
四、利用
(十二)智算中心跨域互联利用
揭榜工作:优化人为智能算力基础设施布局,构建跨地域互补、协同算力调度的超大规模人为智能算力服务能力。加强与人为智能芯片厂商的兼容适配,构筑大规模高机能异构算力池,提供面向大模型训推场景深杜着化的弹性调度、弹性容错、高资源利用率的人为智能算力服务。
预期指标:到2026年,形成覆盖5个以上全国沉点算力枢纽节点的人为智能算力中心,支持跨地域、跨云的算力需要感知和动态调度,实现3款以上算力芯片适配,聚焦大模型训练和推理场景,构建大规模、高机能、弹性调度、高容错的训推一体算力资源池,具备分钟级断点续训能力,支持万卡级别并行训练。
(十三)算力电力协同利用
揭榜工作:研发基于算力调度技术与能源大模型的多云异构算电协同治理平台,构建基于数据驱动的算力集群用电负荷个性模型、基于推算工作的时空转移个性的能源大模型,推动算力预测与调度技术在智算中心利用落地,提升整体资源利用率,基于新能源、新型储能系统发展算力负荷与电力系统的协同优化,实现精准、动态、实时的能源调杜纂买卖,实现算力与电力等能源的深度协同。
预期指标:到2026年,实现智算场景下能源与算力全链路的数据穿透及流程整合,构建“算”随“电”动的直接节造及间接疏导机造,实现算力需要预测精准度达到70%、集群有效负载率提升25%以上,智算中心整体集群资源利用率提高10%。结合算力集群用电数据、功夫周期、形象数据、工作负载等多种成分,实现“电”随“算”用的能源效能优化与算效提升,实现基础设施用能决策精准度85%以上,响应时效性达到提前15分钟响应级别,智算中心整体算力能效水平提升30%,算力中心用电成本降低5%以上。
(十四)大规模通讯业务场景中的算力利用
揭榜工作:萦绕网络职能虚构化(NFV)系统架构,针对NFV中网络机能、资源利用和矫捷展性等方面的挑战,研发面向NFV架构的高机能虚构化、智能化网络治理和资源编排算法等技术和系统,突破虚构化层与硬件加快器(如FPGA、DPU、GPU)之间的协同能力。
预期指标:到2026年,NFV算力平台系统中实现对虚
拟化网络职能的智能调度,支持异构集群部署、动态扩大,资源动态分配,虚构化资源利用率提升20%以上;支持GPU、FPGA蹬撞件加快器的虚构化调度,加快网络处置机能至Tbps以上;支持智能化网络虚构化职能治理,提升NFV系统的自动化运维能力和治理效力,故障建复功夫缩减不低于30%。
五、绿色低碳
(十五)绿色算力技术钻研及利用
揭榜工作:萦绕算力的绿色节能技术突破,面向算力中的工作调度个性、能源使用模式、负载平衡要求等关键身分,研发适应于绿色推算的动态资源调度算法、能耗优化治理系统,以及面向多场景的协同节能机造,突破节能算法的智能化水平,提升算力网络中多节点的能源利用效能。
预期指标:到2026年,能耗治理系统实现对算力中心和网络节点的实时监控与节能调度,通过推算节点支持动态调频、动态电压调节,单节点均匀能耗降低30%以上,满足AI推理蹬爪用需要。
(十六)企业绿色推算碳感知平台
揭榜工作:成立企业算力中心碳排放怀抱系统,可能实时、精准地统计企业各个算力中心碳排放,并能将碳排放量分摊到分歧的业务部门、利用场景和工作负载,实现精密化的碳排放的治理。同时,基于碳排放的数据,实现碳感知调度能力,通过在保障业务履历和陆续性的情况下将工作负载
调度到越发低碳的算力中心,进一步降低碳排放。
预期指标:到2026年,萦绕千万核级别跨域的算力中心,构建企业级绿色推算碳感知平台,形成一套行业通用的、可精确怀抱分歧类型工作负载碳排放的技术步骤和指标系统,通过生态共建形成绿色怀抱衡尺度系统。构建碳感知调度能力,达到算力中心可再生能源比例30%的指标。
(十七)冷板式液冷原生整机柜服务器
揭榜工作:面向新一代液冷算力中心,研发冷板式液冷整机柜,蕴含液冷服务器节点、无源液冷门等,突破高密算力、多样性算力的散热技术及架构要求,实现支持供电总线、网络互联总线、液冷管路可盲插运维的液冷设备,具备液冷机柜及液冷服务器等多级漏液检测能力,有效降低业务中断领域与损失。
预期指标:到2026年,液冷整机柜实现100%液冷散热,造冷PUE低于1.15。整机柜服务器内部实现全盲插设计,治理?榭墒迪终窆闹卫怼⒙┮杭觳狻⒆什卫淼戎澳;通用算力单柜功率不低于20kW,智能算力单机柜功率不低于30kW,实现不少于500台液冷节点的规模落地利用。
(十八)算力中心节能调优平台
揭榜工作:研造高精确度、高仿真效能、多场景覆盖的算力中心PUE仿真平台,突破物理机理模型构建、仿真引擎集群、模型自动天生等关键技术,实现对算力中心分歧运行状态下细分功夫颗粒度PUE的急剧、精准评估。研发基于大
数据分析技术的算力中心造冷系统AI节能优化系统,通过自动化数据治理、自动推理等关键技术,正确匹配造冷需要,在满足靠得住性要求前提下实现算力中心造冷系统整体动态实时优化,优化算力中心PUE。
预期指标:到2026年,支持液冷、水冷等至少2类典型造冷场景进行能效优化,支持造冷系统和配电系吐洫合仿真,系统可输出分歧负载及运行工况前提下的PUE运行曲线、系统设备运行模拟工况等参数,PUE仿真精度达到97%以上;谀苄в呕教,支持AI自动推理,幼时级战术自动下发,实现对算力中心能耗的可视、可管、可控。通过AI能效优化,实现算力中心PUE降低5%以上,通过算力中心基础设施与IT联动节能,实现总能耗降低5%以上,在5个以上算力中心落地利用。
(十九)新型造冷系统
揭榜工作:研发人为智能节能系统,针对算力中心基础设施的运行调控和环境监测。提出全新自适应算法,突破原有常见算法的局限性,提升数据的分析和处置成效,搭建基于专家经验的人为智能算法数据库,提升蕴含能耗治理、能源调度、安全监测、故障诊断、辅助运维等职能的节能性、靠得住性、经济性。
预期指标:到2026年,在满足造冷要求的基础上,提高冷却系统的靠得住性和自适应性,提高能源使用效能、水资源使用效能和运维效能,其中节电率提升10%以上。支持冷
却系统数据采集、标注、治理、存储,具备系统运行异常告警、告警收敛、自动诊断、远程通讯、自动节造等职能,支持冷却系统智能化调优、智能化节造的主题能力,并发展不少于5个现实业务场景所提供的AI节能调优案例。
六、安全靠得住
(二十)算力中心智能运维机械人
揭榜工作:研发算力中心智能运维机械人以及智能机械人治理平台,基于云边端三层架构,实现智能机械人在多层、多房间楼宇机房内的设备设施鉴别、多模态环境感知、精准空间定位、智能人机协同、多工作结合调度等方面的技术与算法优化。支持机械人在算力中心设施运维和IT运营等典型场景的利用,提升巡检质量,推进算力中心运维、运营的降本增效。
预期指标:到2026年,实现大型算力中心内智能机械人的多机房、多楼层协同利用部署;机械人巡检工作成功率不低于95%,设备鉴别正确率达到97%,环境巡检召回率不低于90%,保险算力中心巡检业务持续运行。实现云边端协同调度,支持分歧场景下的自主作业,提高工作并发执行效能,推进不变、安全、靠得住、可控的算力中心智能运维系统建设。
(二十一)云边端一体化智能监测平台
揭榜工作:开发高机能云边端一体化系统,研发以智能化终端或机械报答硬件载体、以多算法模型融合和平台工具
为软件载体的软硬结合的集中监测治理与运维巡检规划。突破多层级自动化运维、多维度诊断、多平台覆盖、多模型量化等关键技术。构建综合运维健全度数字化评估系统与模型,实现算力设施从规划、设计、建设、部署、运杏注守护的全性命周期数字化治理。
预期指标:到2026年,成立大规模集群的智能化运维能力,设备实现跨平台及系统不变性风险和安全风险鉴别能力,综合视频鉴别技术等,结构化告警收敛推送,正确率超过98%。算力设施全性命周期数字化联动,平台自动化流程推动,实现云端直控覆盖超10栋算力中心,落地数字化算力中心健全度评估,智能化终端或机械人的自驱动巡检,视频流鉴别与告警的联动,系统的智能化运维问答,并保险业务服务级别和谈(SLA)达标率99%以上。
七、其他
(二十二)其他算力领域的特色化技术、产品、服务和平台等,应拥有技术先进性,技术成熟度较高,产业化远景较好。
附:1.算力强基揭榜单元推荐表
2.算力强基揭榜单元申报资料

