9 月 20 日,华为昇腾计算业务总裁张迪煊站在华为全联接大会的舞台上,阐述的重点已从几天前发布的新一代芯片性能,转向一个更核心的议题:如何让这些软硬件能力真正为开发者所用。台下,人们捕捉到一个明确的信号:昇腾,正邀请开发者上场。
张迪煊用接下来的时间,清晰地勾勒出了一条清晰的路径,即通过彻底的共享奠定基础,通过开放的共创激发活力,最终与开发者共同定义未来的技术范式。
共享:从资源普惠到底层代码的全面开放
共享,是这场变革的起点。其核心是将昇腾积累多年的技术资产系统性地开放,从底层资源到上层范式全面赋能开发者。通过 CANN 的分层解耦架构,开发者能够灵活调用从模型、算子、内核以及底层硬件的各层级能力,从根本上降低复杂 AI 应用开发的难度与门槛。
在这一方向上,张迪煊给出了一份明确的开源计划,包括 9 月底,CANN 全量算子将开源到 GitCode 社区,12 月底,领域加速库、图引擎、Ascend C、MindIE 等软件代码陆续上仓,实现基础软件全栈开源。这意味着,驱动昇腾 AI 算力的核心软件层,将彻底向开发者敞开。
开放不止于应用层代码。更具深度的是底层运行时能力的开源,它赋予开发者对硬件资源进行细粒度调度的权限,以满足对性能有极致要求的场景。定于 9 月底开源的共享内存能力 Share Memory 即是一例,它支持在超节点范围内将片上内存资源池化共享,并通过 Load and Store 方式通信,大幅降低延迟,同时使相关算子的代码量减少约 60%,极大提升开发效率。
为满足多样化的开发需求,昇腾也体现出广泛的兼容性。下一代昇腾产品将同时支持 SIMD 与 SIMT 两种模式。SIMD 擅长处理 Transformer 类模型的规则计算,其新增的融合编程特性可提升 30% 的开发效率;而 SIMT 则更适用于搜索推荐等场景中的逻辑类计算,实测至少能带来 2.5 倍的性能提升。这种设计为不同技术路径的开发者提供了更自由的选择空间。
资源支持也是共享的重要一环。华为承诺每年投入 1500P 算力与 3 万片开发板,为开发者提供底层资源支持。此外,昇腾还将持续与 Triton、PyTorch、vLLM 等主流开源社区合作,确保其最新功能与优化能及时回馈社区,保持生态同步。
共创:从单向使能到社区生态的双向互动
共享资源只是第一步,真正的生态活力来源于持续的共创。当开发者不仅能使用代码,还能反过来影响代码的演进方向时,一种更深层次的联结便建立了。这种联结在代码、工具与产业实践的深度融合中取得了初步成果。
在代码层面,社区贡献成为生态进化的重要源泉。无问芯穹基于 CATLASS 模板库开发的 Group GEMM 算子,相比 aclNN 算子,性能提升了 50%。这个由 AI Infra 伙伴和开发者基于 CANN 所共创的成果目前已被合入主分支,为所有开发者共享。
在工具层面,共创机制实现了实践经验的持续反哺。开源工具 msProfiler 实现了算法调优的自动化。其知识库由华为与华南理工、科大讯飞等机构持续共建,并融入了招商银行等客户的实战调优参数,最终实现 20 倍的调优效率提升。
在产业创新层面,共创推动了前沿技术的快速验证与落地。张迪煊重点分享了昇腾与阶跃星辰联合创新的"Attention 与 FFN 分离部署"推理加速方案。该设计基于"以通信换内存"的思路,成功将 Decode 推理吞吐提升 50% 以上。该方案的代码将于 9 月 30 日开源至 vLLM 社区,为高并发推理场景提供重要技术范本。
共同定义:从标准适配到范式创新的时代机遇
当代码开源与协同共建成为常态,昇腾生态与开发者的关系正迈向更高层次。在这一阶段,开发者不再局限于在既定框架内进行应用和创新,而是逐步获得参与定义生态底层规则与未来形态的权利。
这一转变最根本的体现是 CANN 技术指导委员会的正式成立。这是迈向共同定义的关键制度设计。它意味着 CANN 全面走向社区化运作,昇腾核心软件的未来将由一个融入社区核心贡献者的组织共同决策。开发者提交的 Pull Request、在社区讨论中提出的见解,都可能直接影响技术路线的演进。
当开发者开始在治理层面拥有话语权,共同定义的范畴便自然从程序治理扩展至技术规则的制定。华为将创新的 HiF8 数据格式捐献至 GCC 全球计算联盟,并推动 IEEE 启动标准立项,其本质是将底层技术标准的制定过程向全球开放。当前与利兹大学、清华、复旦、科大讯飞等高校与企业的联合验证,正是社区共同打磨、定义下一代数据格式的实践。这标志着开发者从过去被动的"标准适配者",转变为能够共同打磨、影响乃至最终决定标准形态的"定义参与者"。
在此基础上,开发者社区开始主动探索更底层、更本质的编程范式创新。北大杨智老师团队自研的 TileLang 编程语言已与 CANN 成功对接,提供 Tile-level 的类 Python 编程方式,并将 FlashAttention 算子的代码量从 500 多行精简至 80 行,下一步还将支持 Expert 模式和 Beginner 模式,兼顾性能和易用性。这表明,昇腾生态不仅接纳上层的应用创新,更愿意将社区带来的全新开发范式沉淀为核心能力。开发者也由此深度参与到塑造未来工具链和编程范式的进程中。
从代码资源的全面共享,到技术路径的协同共创,再到标准范式的共同定义,华为昇腾所展现的,是一条清晰、系统且逐层深入的开发者赋能路径,正是沿着这条路径,开发者得以走到舞台中央。"我们第一次有机会,和全球的开发者站在一起,去定义一个新标准,去开创一个新范式,去引领一个新时代!。" 张迪煊说。
或许从这个意义上看,昇腾与开发者的故事才刚刚开始。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。