在2024年10月15日至17日,环球瞩指标洞开揣测环球峰会(OCP Global Summit)在好意思国加州圣何塞举行。本届峰会以“改动的力量”为主题,聚焦于AI基础要害时期生态的构建,勾引了超越7000名环球基础要害界限的各人参与。在这个充满改动氛围的舞台上,阿里云的磐久AI Infra 2.0办事器联袂UALink定约,共同展示了他们在AI互连时期界限的最新恶果。
峰会上,阿里云办事器研发资深总监文芳志与UALink定约主席Kurtis Bowman联接发表了题为《UALink:加快AI的将来》的演讲,共同筹商了AI办事器Scale UP互连时期的最新发展,UALink模范的演进旅途,以及UALink定约与ALink System产业生态的协同相助后劲。
UALink公约,看成一项新兴的行业模范,由AI芯片、办事器和云办事提供商等行业带领者共同发起,旨在鼓吹AI办事器Scale UP互连时期的发展。UALink公约以其高性能内存语义拜访、显存分享、接济Switch组网模式以及超高带宽和超低时延等特点,为AI办事器Scale UP互连时期的发展提供了新的能源。UALink定约有经营于10月底厚爱确立,并在年底发布初版UALink spec,这标识着AI办事器互连时期将插足一个新的发展阶段。
濒临环球尤其是中国市集的挑战,ALink System(ALS)产业生态应时而生,旨在鼓吹UALink模范的落地践诺。ALS提供了长入模范的互联络统,包括ALS-D数据面和ALS-M管控面,为AI练习和推理场景提供全面的惩处决策。
ALS-D接济UALink国外模范,酿成了具有竞争力的数据面决策。它不仅接济高性能内存语义拜访和显存分享,还具备超高带宽和超低时延,同期增多了网内揣测等特点。ALS-M则为不同芯片决策提供模范化的接入决策,接济洞开生态和厂商私有互连公约的长入软件接口,为云揣测等集群看守场景提供生动和弹性的建树才气。
奉命ALink System范例,阿里云假想了面向下一代超大范畴AI集群的磐久AI Infra 2.0办事器。该办事器体现了洞开生态、高能效、高性能和高可用的假想理念,界说了AI揣测节点和Scale Up/Scale Out互联络统,接济业界主流AI决策,鼓吹了AI界限的“一云多芯”发展。
互联络统ALink System全面兼容UALink生态,与行业伙伴共同构建超高性能、超大范畴的Scale UP集群互连才气。一级互连接济64-80个节点,二级互连可达2000个以上节点,提供了PB级分享显存和TB级互连带宽,为AI的发展提供了宏大的接济。
AI Infra 2.0办事器集成了阿里自研的CIPU 3.0芯片,接济高带宽大范畴AI办事器的Scale Out网罗膨胀,同期得志云网罗的弹性和安全需求。在硬件工程方面,AI Infra 2.0办事器单机柜接济最大80个AI揣测节点,业界密度最高;接纳400V PSU,单体供电着力可达98%,举座供电着力提高2%。散热假想上,机柜级液冷决策不错笔据骨子负载动态调养CDU冷却才气来降拘泥耗,单柜冷却系统节能30%。在运维看守上,全新的CableCartridge后爱护假想,接济全盲插,零理线易运维、零误操作,爱护着力升迁50%。
在可靠性方面,AI Infra 2.0办事器接济弹性节点、智能路由、高可靠供电、分离式CDU等时期,不错及时监控、探伤各式硬件故障并自愈,硬件的故障域也缩减到节点级。
阿里云在ALink System产业生态诱导上,秉握洞开相助的政策,鼓吹互连时期界限的发展和茁壮。自ALink System产业生态在洞开数据中心大会上厚爱发布以来,已有20多家AI芯片、互连芯片、办事器整机硬件和IP假想厂商加入,成员单元已就相干公约模范制定和实行旅途礼聘伸开通常。
阿里云不仅是UALink的积极接济者和ALink System产业生态的牵头者,也曾OCP、CXL、UCIe和UEC等多个互连时期行业组织的创举成员或时期委员会成员,并用骨子活动接济相干洞开互连时期模范的制定和落地。
通过这些相助和勤劳,阿里云磐久AI Infra 2.0办事器与UALink定约的联袂,不仅展示了阿里云在AI基础要害界限的时期实力和改动才气,也体现了阿里云在鼓吹洞开揣测和AI时期发展中的带领地位。阿里云将持续引颈AI时期的将来发展,为环球客户提供愈加宏大、生动和高效的AI基础要害惩处决策。
在本届OCP峰会上,阿里云的展示和盘问不仅为与会者提供了深刻了解AI互连时期的契机,也为行业表里的不雅察者花样了一个由改动启动的AI将来。跟着时期的不断越过和相助的深刻,咱们多情理降服,阿里云磐久AI Infra 2.0办事器将在AI界限演出越来越蹙迫的脚色,为百行万企的数字化转型提供强有劲的接济。