图片来源:视觉中国
万物智联时代,算力已成为数字经济发展的新引擎。作为数字经济时代的新型生产力,算力正在加速融入经济社会的各个领域。
但是,我国算力产业高速发展的同时,算力的调度和使用仍然主要基于单一服务商。面对“东数西算”、大模型计算等场景,业界亟需通过算力互联互通提升算力资源综合使用效率。
【资料图】
6月21日,“2023算力互联互通大会”在北京召开,会上发布了北京算力互联互通验证平台二期等多项重磅成果。北京算力互联互通验证平台是全国首个算力互联互通验证平台,在北京市通信管理局委托下,由中国信通院牵头并联合中国科学院计算机网络信息中心、天翼云等单位共同成立。
作为北京算力互联互通验证平台的支撑平台,天翼云算力分发网络平台“息壤” 不仅能够实现对通用算力的需求,也可以实现人工智能、超算等业务场景下对多样化算力的需求。
“息壤”是天翼云针对分布式应用、算力应用、算网融合调度等场景,自主研发的算力分发网络平台,能够对边缘云、中心云、第三方资源等全网算力进行统一管理和调度,从而构建起一个独特的“算网大脑”。由“息壤”支撑的北京算力互联互通验证平台的落地与应用,标志着算力互联网新纪元正式开启。
算力互联网三大挑战:跨服务商、跨架构、跨地域近年来,我国算力基础设施发展成效显著。根据工业和信息化部数据显示,我国算力总规模已达180EFLOPS,位居全球第二,年增长率近30%。
不过,我国在算力技术创新、应用赋能等方面仍面临诸多挑战,主要原因是算力并不均衡。一是东西部算力不均衡;二是算力模式不均衡,我国通用计算、超算较为领先,而智算相对落后;三是拥有者不均衡,目前大部分算力聚集在少部分企业和单位中,对许多中小企业、初创企业来说,要获取算力难度较高。随着AIGC、大模型浪潮袭来,未来会有越来越多的初创企业需要智算资源,将形成更大的算力需求矛盾。
算力互联互通,则是解决这些矛盾的最好办法,既能够提升算力的利用率,又能够实现算力普惠。只有最有创造力的中小企业、初创企业掌握到需要的算力,中国数字经济才有望取得更蓬勃的发展。
在会上,天翼云智能边缘事业部副总经理鄢智勇表示,算力基础设施的发展经历了三个阶段。第一个阶段是虚拟化,以资源池为核心,第二个是云原生阶段,是以应用为核心,现在进入到第三个阶段,是以算网全域调度,也可以叫做算网云原生为代表。解决算力互联互通问题,则要打破三大壁垒,即跨服务商、跨架构和跨地域。
鄢智勇说:“ 20多年以来,人类对算力的追求始终都是理想的,算力网络的前身是网格计算,网格计算里Grid来源即是电网。所以我们对于理想算力的需求,一直希望能够像使用电力一样非常方便。算力数据中心对应的就是发电厂,算网调度对应输电、变电、配电系统,用电时直接插上插座就可以使用。我们对算力的期待也是希望能够达成这样的效果,只要把算力需求提升上去,就可以自动匹配供应,最终实现统一算力服务输出。”
为了实现算力统一,算力调度的作用非常重要。鄢智勇说:“我们参考之前互联网和电网调度都是分层的,算力调度也可以简化成两层,一层是算力互联互通,即跨服务商、跨资源池、跨地域的调度;第二层是在资源池内如何实现高效的调度,通过一个资源池能够同时提供通用算力、智算、超算混合计算模型。“
算力互联网的本质,是通过系统化的方式解决算力的需求和供给问题。“息壤”就是完成了跨资源池、跨服务商、跨地域的调度。只有打破这三大壁垒,未来算力的使用才会像电力一样,可以“一点接入、即取即用”。
天翼云让算力“无处不在”作为云服务“国家队”,天翼云已经走过了十年科技创新之路,形成广泛资源布局和自研产品能力的双重优势,真正做到让算力“无处不在”。
从算力的维度来看,天翼云已经明确了“2+4+31+X+O”的资源布局,其中“2”是内蒙和贵州;“4”是京津冀、长三角、粤港澳、川陕渝四大区域,满足大规模、集群化、低成本的算力需求;“31”则是在31省的重点城市布局区域云;“X”则是全国多个地市以及更多的县区,按照“一城一池”的标准推进边缘云的覆盖,提供敏捷算力,承载就近接入、超低时延、数据本地化的近场级算力需求;“O”是指海外节点。通过这样的布局,天翼云可为各类用户提供高速泛在的算力。
从技术创新的角度来看,天翼云坚持关键技术全栈自研,包括操作系统、数据库和核心组件。
通过打造定制化的宿主机操作系统CTyunOS和云操作系统TeleCloudOS4.0,天翼云构建了业界领先的云网底座,突破超大规模计算管理与调度、多AZ大规模云网络服务、超大规模存储集群、多AZ大规模集群纳管与监控等多项核心技术,支持多AZ能力,让集群管理规模提升了10倍以上,使得其资源池集群管理调度能力也进入国内云服务提供商第一阵营。
作为IT基础设施领域重要组成部分,数据库是云计算技术的压舱石。随着数字化的不断深入,单一数据库已难以满足日益多元化的企业业务需求。为此,天翼云推出了自研的TeleDB云原生分布式数据库,为政企客户提供就近按需的云服务部署,以及统一的云平台管理能力,助力客户实现更加高效的数据流转与业务创新。目前,该数据库已实现了全面国产化适配,并兼容各类社区生态。
随着数据爆发式增长,计算需求不断走高,业务场景也愈加复杂化,传统以CPU为核心的计算架构已无法满足随时随地的计算需求。这样的行业现状呼唤新型高性能计算架构的产生,来推动算力普惠发展,DPU正是在这样的背景下诞生。
天翼云是较早探索DPU的云厂商。凭借在云领域的成熟技术和应用实践,天翼云在2022年推出了完全自研的紫金DPU芯片,并且以紫金DPU为基础打造了为云而生的全新一代云计算体系结构,将计算、存储、网络和安全算力迁移到完全自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面。天翼云紫金DPU全面释放算力的同时,也将对软硬件系统带来创新变革,推动千行百业的业务层数字化应用更流畅、更绿色,推动数字经济与产业高质量发展。
作为北京算力互联互通验证平台的设计方、核心建设者、资源提供者与标准制定者,天翼云基于自主研发的云操作系统、紫金DPU、算力分发网络平台“息壤”等能力,充分展现了天翼云作为云服务国家队的使命与担当,大力推进算力互联互通,为行业发展作贡献。同时,这也标志着我国在优化算力基础设施布局、结构和功能上实现了跨越式发展,是我国算力调度、算力资源服务化探索的重要一步。
“息壤”构建算力底座,加快建设数字中国算力互联互通与算网一体化调度是解决数据高效流动、优化算力资源布局及数据流动的关键手段,也是数字中国建设的必然发展趋势。
“息壤”好比是一个算力传输的枢纽,能够在全国范围内实现每分钟数万次,每天上千万次的算力统筹和调度,满足各领域对算力的极致需求。
算力与电力调度有非常大的不同,电力是可以实现传输的,从A点传输到B点。但是算力本质上是没办法传输的。我国算力部署在西部,那么计算肯定也是发生在西部,所以算力调度也是分成两步去做,第一步通过编排把应用部署到了目标资源所在地,第二步是把数据和请求调度到应用运行,从而实现算力调度。
目前,“息壤”已经能够按照超广覆盖、超高可靠、超低时延、超大速率、云网一体的标准要求,对边缘云、中心云、第三方资源等全网算力进行统一管理和调度。
这一平台让数据找到了通往最匹配算力中心的最佳路径,真正实现了成本、算力、时延的最优。
可以说,在“息壤”加持下,天翼云可以让客户实现“算力自由”,无论业务对算力的需求是多少,“息壤”都可以规划出满足需求的算力资源并且有效调度,实现业务性能和成本的最优。
凭借优秀的算力调度能力,“息壤”也获得了业内广泛认可,包括入选国资委“2022年度央企十大超级工程”;在第六届数字中国建设成果展览会最佳成果遴选颁奖仪式上,荣获第六届数字中国建设峰会“十大硬核科技” 称号;在第三届国有企业数字化转型论坛上入选国资委发布的“典型数字技术成果”。
图片来源:视觉中国
算力互联互通平台是落实全国算力一体化调度政策、实现算力资源跨区域高效配置的战略基础设施。
不过,将分布在国内各地的数据中心进行统筹和连接,还是算力服务网络的第一步,能否基于业务场景需求向市场输出算力、算法、数据、应用高度协同的一体化资源,同样是算力服务商必须要应对的问题。
算力要和应用产生更加紧密的联系,才能真正促进数字经济生产力。
在算力服务网络方兴未艾的当下,衡量一家服务商竞争力的标准,应该上升到多元化算力的调度能力、一体化的算力运营能力以及生态整合的综合能力,这是连接算力价值的必备因素,也是在算力服务网络争夺赛中胜出的关键。
天翼云作为首个算力互联互通验证平台的设计方、建设方、资源提供方和标准制定参与方,在大力推动全国算力互联互通平台建设的同时,还将推动算力普惠发展和产业数字化转型,为农业、工业、物流、金融、能源等多个领域客户提供服务,不断释放出新的经济增长动能和社会价值,加速中国算力奔跑向前。
中国算力速度仍在不断刷新。在推动我国成为全球算力强国的路上,以天翼云为代表的越来越多的科技企业正以创新为驱动,迈出做大做强数字经济的稳健步伐。
关键词: