华为袁远：AI的第一程是算力下半程在于数据-开云集团管理有限公司

2026-05-23 20:04:18

华为袁远：AI的第一程是算力下半程在于数据

分享到：

　　5月21日，在巴黎举办的2026华为创新数据基础设施论坛上，华为公司副总裁、数据存储产品线总裁袁远，给出了两个数字。第一个数字是3000万，这是目前活跃地为人类工作的智能体数量；第二个数字是22亿，这是五年后全球智能体将达到的规模。两个数字之间，是一场关于企业形态、商业模式乃至整个社会经济运行逻辑的深刻变革。

　　袁远判断，“未来一个人加一个智能体就可以成为一家公司”。这不是对遥远未来的畅想，而是正在发生的现实。当智能体从辅助工具演变为数字员工，企业IT基础设施面临的根本性问题也随之浮出水面：我们现有的数据架构，是否真的为AI做好了准备？

　　要理解这个问题，不妨看看袁远分享的一家中国顶级医院的转型案例。每年数百万患者、数千张床位，病理医生检查一份组织切片需要40多分钟，这是传统效率的天花板。引入AI能力之后，他们只用了16张卡，搭建了三个模型：一个识别癌细胞，一个连接显微镜，一个大模型与患者沟通。模型学习了300本医学书籍，并用100万患者的数字病理数据进行了训练。结果病理诊断从40分钟缩减到15秒，同时能准确识别19种常见癌症。

　　这个案例的启示远不止于效率提升本身。关键在于，医院选择了本地部署AI堆栈，而非依赖公共AI服务。袁远在论坛上特别强调了这一点：“医院的病理数据、诊断标准、患者隐私要求，决定了它不能将核心医疗流程托付给一个通用的公共模型。

华为袁远：AI的第一程是算力下半程在于数据(图1)

　　AI本地化应用，远比采购几台服务器、安装几个软件复杂。袁远指出，企业要加速AI落地，需推动现有IT架构向AI DC数据基础设施快速演进，围绕数据湖、知识与记忆平台、算力、模型、Agent框架与数据韧性等核心方向，开展系统性规划与建设。

　　先看数据湖。一家决心在2030年推出自动驾驶汽车的公司，需要L5级自动驾驶，这意味着要管理来自雷达、传感器、环境的超过1000PB数据，还要跨数据中心实现全局可见性，以及在几秒内从千亿级文件中检索出极端场景的图片，比如红灯下奔跑的狗、雨天的复杂路况。数据湖的作用正是在海量容量、全局可见性和超快速语义检索之间取得平衡。

　　再看知识和记忆平台。一家金融机构在AI编码过程发现需要15轮甚至200轮的反复推理，每一轮GPU反复处理同样的键值上下文既不划算也不可持续。解决方案是KV缓存，用存储消除冗余的KV计算，为推理过程提供可访问的缓存能力，从而大幅节省成本和时间。而让AI编码越来越可靠的关键，是一个内存系统，把调试经验、工程版本迭代中的教训总结进去，让编码结构不断进化。袁远打了个比方：“人类更聪明是因为我们有记忆。”

　　当这四层架构——智能体框架、模型层、计算层、知识与记忆平台叠加在一起，企业面对的就不只是技术选型问题，还有一个更根本的挑战：如何让这一切安全地运行？

　　袁远指出：不加控制的智能体会删除文件、改变规则、做出预料之外的举动；坏人可能投毒模型、引入恶意代码、篡改关键数据。这些不是理论上的威胁。因此，华为在AI DC数据基础设施全栈方案中，将数据韧性作为贯穿所有层面的核心能力——防滥用、防投毒、防篡改、防勒索，形成端到端的保护。

华为袁远：AI的第一程是算力下半程在于数据(图2)

　　从这些案例中可以看到一个清晰的逻辑链条：AI的落地效果，最终取决于数据基础设施能否支撑起从数据采集、储存、检索到模型训练、推理、智能体进化的全流程。

　　袁远在演讲中提出了一个判断，“AI的第一个篇章是算力，随着GPT的普及已经全球实现；第二篇章是模型，Gemini、DeepSeek等百花齐放；第三篇章是智能体，非常流行。而下半程在于数据。”为什么是数据？因为算力和模型已逐渐成为基础设施级的公用资源，真正决定一家企业能否在AI时代建立差异化竞争优势的，是其是否拥有高质量、安全、可控的数据资产，以及是否具备将数据资产高效转化为业务价值的基础设施能力。

　　在论坛上，华为发布的AI DC数据基础设施全栈方案，正是回应这一需求：OceanStor Pacific以11PB/2U的高容量密度和0.25瓦/TB的低功耗构建AI数据湖；发布面向超大规模推理集群、业界首个支持异构算力上下文记忆存储CMS，能将推理首Token时延降低90%；ModelEngine实现模型的开箱即用和XPU资源的1:10细粒度切分；ModelEngine Nexent则让智能体的开发周期缩短80%。这些技术参数背后，是一个清晰的行业趋势：企业不需要从零开始摸索如何构建AI就绪的数据架构，但也不能指望一个通用的公共平台能解决所有问题。私有堆栈、本地部署、端到端的安全与记忆机制，才是通往AI深度应用的关键路径。

　　回看袁远给出的数字，全球Token的每分钟消耗量从去年的60亿增长到今年的150亿。Token正在成为像空气和水一样的必需品，这意味着AI已经渗透进日常运营的每一个毛孔。医院、汽车公司、金融机构、银行的案例表明，无论喜欢与否，没有一家企业能置身于事外。区别只在于：是主动构建一个能承载智能体、记忆、安全与进化的数据基础设施，还是在零散的工具和公共API的拼凑中，错失智能体变革的时代机遇。

　　沪ICP备10213822号-2互联网新闻信息服务许可证：网登网视备（沪）-1号互联网宗教信息服务许可证：沪（2024）0000009 广播电视节目制作经营许可证：（沪）字第03952号

　　增值电信业务经营许可证：沪B2-20210968 违法及不良信息举报电话

新闻资讯

华为袁远：AI的第一程是算力下半程在于数据