模板文件不存在: ./template/pc/header.htm

新闻资讯

2026-05-23 20:04:18

华为袁远:AI的第一程是算力下半程在于数据

分享到:

  5月21日,在巴黎举办的2026华为创新数据基础设施论坛上,华为公司副总裁、数据存储产品线总裁袁远,给出了两个数字。第一个数字是3000万,这是目前活跃地为人类工作的智能体数量;第二个数字是22亿,这是五年后全球智能体将达到的规模。两个数字之间,是一场关于企业形态、商业模式乃至整个社会经济运行逻辑的深刻变革。

  袁远判断,“未来一个人加一个智能体就可以成为一家公司”。这不是对遥远未来的畅想,而是正在发生的现实。当智能体从辅助工具演变为数字员工,企业IT基础设施面临的根本性问题也随之浮出水面:我们现有的数据架构,是否真的为AI做好了准备?

  要理解这个问题,不妨看看袁远分享的一家中国顶级医院的转型案例。每年数百万患者、数千张床位,病理医生检查一份组织切片需要40多分钟,这是传统效率的天花板。引入AI能力之后,他们只用了16张卡,搭建了三个模型:一个识别癌细胞,一个连接显微镜,一个大模型与患者沟通。模型学习了300本医学书籍,并用100万患者的数字病理数据进行了训练。结果病理诊断从40分钟缩减到15秒,同时能准确识别19种常见癌症。

  这个案例的启示远不止于效率提升本身。关键在于,医院选择了本地部署AI堆栈,而非依赖公共AI服务。袁远在论坛上特别强调了这一点:“医院的病理数据、诊断标准、患者隐私要求,决定了它不能将核心医疗流程托付给一个通用的公共模型。

华为袁远:AI的第一程是算力下半程在于数据(图1)

  AI本地化应用,远比采购几台服务器、安装几个软件复杂。袁远指出,企业要加速AI落地,需推动现有IT架构向AI DC数据基础设施快速演进,围绕数据湖、知识与记忆平台、算力、模型、Agent框架与数据韧性等核心方向,开展系统性规划与建设。

  先看数据湖。一家决心在2030年推出自动驾驶汽车的公司,需要L5级自动驾驶,这意味着要管理来自雷达、传感器、环境的超过1000PB数据,还要跨数据中心实现全局可见性,以及在几秒内从千亿级文件中检索出极端场景的图片,比如红灯下奔跑的狗、雨天的复杂路况。数据湖的作用正是在海量容量、全局可见性和超快速语义检索之间取得平衡。

  再看知识和记忆平台。一家金融机构在AI编码过程发现需要15轮甚至200轮的反复推理,每一轮GPU反复处理同样的键值上下文既不划算也不可持续。解决方案是KV缓存,用存储消除冗余的KV计算,为推理过程提供可访问的缓存能力,从而大幅节省成本和时间。而让AI编码越来越可靠的关键,是一个内存系统,把调试经验、工程版本迭代中的教训总结进去,让编码结构不断进化。袁远打了个比方:“人类更聪明是因为我们有记忆。”

  当这四层架构——智能体框架、模型层、计算层、知识与记忆平台叠加在一起,企业面对的就不只是技术选型问题,还有一个更根本的挑战:如何让这一切安全地运行?

  袁远指出:不加控制的智能体会删除文件、改变规则、做出预料之外的举动;坏人可能投毒模型、引入恶意代码、篡改关键数据。这些不是理论上的威胁。因此,华为在AI DC数据基础设施全栈方案中,将数据韧性作为贯穿所有层面的核心能力——防滥用、防投毒、防篡改、防勒索,形成端到端的保护。

华为袁远:AI的第一程是算力下半程在于数据(图2)

  从这些案例中可以看到一个清晰的逻辑链条:AI的落地效果,最终取决于数据基础设施能否支撑起从数据采集、储存、检索到模型训练、推理、智能体进化的全流程。

  袁远在演讲中提出了一个判断,“AI的第一个篇章是算力,随着GPT的普及已经全球实现;第二篇章是模型,Gemini、DeepSeek等百花齐放;第三篇章是智能体,非常流行。而下半程在于数据。”为什么是数据?因为算力和模型已逐渐成为基础设施级的公用资源,真正决定一家企业能否在AI时代建立差异化竞争优势的,是其是否拥有高质量、安全、可控的数据资产,以及是否具备将数据资产高效转化为业务价值的基础设施能力。

  在论坛上,华为发布的AI DC数据基础设施全栈方案,正是回应这一需求:OceanStor Pacific以11PB/2U的高容量密度和0.25瓦/TB的低功耗构建AI数据湖;发布面向超大规模推理集群、业界首个支持异构算力上下文记忆存储CMS,能将推理首Token时延降低90%;ModelEngine实现模型的开箱即用和XPU资源的1:10细粒度切分;ModelEngine Nexent则让智能体的开发周期缩短80%。这些技术参数背后,是一个清晰的行业趋势:企业不需要从零开始摸索如何构建AI就绪的数据架构,但也不能指望一个通用的公共平台能解决所有问题。私有堆栈、本地部署、端到端的安全与记忆机制,才是通往AI深度应用的关键路径。

  回看袁远给出的数字,全球Token的每分钟消耗量从去年的60亿增长到今年的150亿。Token正在成为像空气和水一样的必需品,这意味着AI已经渗透进日常运营的每一个毛孔。医院、汽车公司、金融机构、银行的案例表明,无论喜欢与否,没有一家企业能置身于事外。区别只在于:是主动构建一个能承载智能体、记忆、安全与进化的数据基础设施,还是在零散的工具和公共API的拼凑中,错失智能体变革的时代机遇。

  沪ICP备10213822号-2互联网新闻信息服务许可证: 网登网视备(沪)-1号 互联网宗教信息服务许可证:沪(2024)0000009 广播电视节目制作经营许可证:(沪)字第03952号

  增值电信业务经营许可证:沪B2-20210968 违法及不良信息举报电话

上一篇:AI数据采集、处理技术的说明
下一篇:电动汽车