
当万卡集群成为AI武备竞赛的入场券,一个永恒被忽略却至关进攻的“隐形瓶颈”正浮出水面:卡与卡之间的互联堵、功耗高、时延大。算力堆得再高,信号却堵在“红绿灯”前,成了扫数系统启动的最大牵涉。OCS——光电路交换机,恰是解开这谈死结的钥匙。
要劝诱OCS,不妨先看一个比方。传统的数据传输,好比一条国谈,光信号跑着跑着就遭遇收费站,必须停驻来诊疗成电信号智力延续通行。每次交换王人要资历“光→电→光”的诊疗。每一站王人有“红绿灯”,不仅跑不快,还巨费电。
而OCS作念的,即是把这些收费站竣工拆掉,让光信号径直在光路里完成交换,全程无须往复折腾。OCS实质上是一个光开关矩阵,通过动态调整光路,诞生端到端的光通谈,像在高速公路上径直架起立交桥,让数据直来直往。这恰是AI大模子检修最需要的通讯时势:高带宽、低时延、低功耗。
与传统电交换机比拟,接下来将先容OCS的4个中枢上风:
1.蔓延压到纳秒级
OCS无需光电诊疗,开云app交换蔓延达到纳秒级别,仅为传统电交换机的1/100。在万卡集群中,这种“豪厘必争”的协同端正普及,能灵验减少算力花费。
2.功耗低
传统电交换机每作念一次光电诊疗王人要破钞大批电能,而OCS仅驱动模块耗电。字据朗维光子的数据显现,OCS端口功耗较同等带宽电交换机缩小60%以上,能大幅缩小数据中心运营资本。
3.架构简化
传统数据中心遴荐"中枢-集聚-接入"三层架构,数据包需要屡次跳转。OCS解救全光交叉劝诱,不错杀青光信号的"一跳直达",减少中间集聚层级。这种扁平化架构缩小了时延,还普及了鸠集可靠性。
4.故障秒级切换
OCS解救故障节点秒级切换和断点续训,保证模子长稳续训才略。遴荐模块化野心,配备冗余电源与智能监测系统,将潜在停机技艺降至最低。
当AI大模子的检修范围从千卡向万卡、甚而十万卡迈进,传统电交换机的带宽拘谨和功耗墙问题仍是触顶。而OCS正凭借其全光传输的低时延、低功耗、高蔓延性,成为下一代AI算力鸠集的中枢基础次序。
视频内容由越声搭理投资参谋人:陈嘉辉(登记编号:A0590622120002)、袁水洋(登记编号:A0590619110002)等进行裁剪整理,视频中的信息均开端于公开贵府开云app在线体育,仅代表个东谈主不雅点,任何投资提出不四肢投资依据。
开云体育(kaiyun)官方网站
备案号: