过去一年,英伟达CEO黄仁勋频繁现身于多国政府举办的峰会论坛上,游走拜会各国政要时,都会反复提及一个话题“主权AI”。

主权AI的核心理念认为,每个国家都应该拥有自己的AI基础设施、数据和智能生产能力,以保护国家主权、文化、经济潜力。而以国家为单位建立的主权AI要做到独立自主,不能依赖外部力量。用黄仁勋2024年在迪拜世界政府峰会上演讲的一句话总结——“你不能让别人来做这件事”。

在中国,AI崛起与国产化一直同频共振。从百模大战追赶ChatGPT,到DeepSeek、通义千问吸引全球关注中国AI创新,在国产AI模型陆续 “上牌桌”的另一面,是国内AI从业者从一开始就立足于独立自主,从0到1搭建国产化产业生态,将AI主权牢牢握在手中。



而商汤科技就是这条隐秘战线上的先行者。

这家2014年成立的中国本土AI公司,当生成式AI大语言模型席卷全球之时,坚定投入转型。在去年成立十周年之际,公司已经形成“大装置-大模型-应用”三位一体的生成式AI业务生态,2024年全年贡献了其60%以上的营收。今年上半年,这一比例继续升至77%。

啃下AI国产化最硬的骨头

经济学领域有一个基本原理,谁掌握生产工具,谁就能决定生产过程,从而掌握主导权。

商汤比许多同行更早意识到,AI的竞争不只是模型或算法的竞争,基础设施的竞争往往能决定AI由谁生产,发展AI的主动权在谁手中。

2019年,在ChatGPT还未诞生前,商汤科技内部就提出了自建“大装置”的构想。

在内部的设想中,大装置是超大规模的AI基础设施,解决所有生产AI过程中的关键问题:算力层以自建的AI数据中心(AIDC)为核心,支持模型训练与算力调度;在此基础之上,平台层囊括数据平台、AI框架、推理引擎等AI开发的关键工具;模型层则包括模型相关的算法与软件技术。

而基础设施需要巨额投资撬动。2020年7月,商汤递交上市招股书时,其中一项重要投资是在上海临港落地建设公司的第一座智算数据中心,56亿的总投资额已是商汤该年营收的1.6倍。

商汤董事长兼CEO徐立后来在公司十周年年会上回忆,商汤的大装置计划在公司内外都面临很大争议。内部很多人不理解,作为一家AI公司,商汤为什么要顶着亏损自建重资产基础设施,外界当时也认为,数据中心是云计算的生意,与阿里云等云计算大厂的服务相比,专门针对AI提供算力的需求太小,没有市场。

但商汤依然决心啃下这块最硬的骨头。

2022年,临港智算中心一期工程投入运营,算力规模达14000 PFLOPS(每秒千兆亿次浮点运算),超过了最初立项规划(3740 PFLOPS)的4倍不止。至2025年8月,商汤大装置GPU达5.4万块,运营总算力已突破2.5万PetaFLOPS。

再到后来国内AI行业掀起“百模大战”、AI算力长期供不应求时,基础设施的重要性已经不言自明,而国产化已成为当下共识。

商汤科技董事长兼CEO徐立曾说,商汤大装置从立项第一天起就被看作“打破业内共识,创造新共识”的典型案例。而在商汤落地大装置计划的过程中,国产化是其一直同步推进的事情。

商汤希望大装置能成为国产芯片在真实场景中应用的“试验场”。为此在投建算力中心时,公司不仅批量采购多款国产芯片产品,同时与华为昇腾、寒武纪、沐曦、摩尔线程、壁仞等国产芯片厂商建立长期合作关系,针对20多款国产芯片做兼容适配。

以寒武纪为例。12月15日,在商汤发布行业首个多影视剧集视频生成智能体Seko2.0的当天,寒武纪官宣Day 0就已完成了对商汤自研日日新Seko系列模型的适配。能做到这一点的基础是双方10月签署正式合作协议后的紧密合作。适配完成后,两家公司还将在优化模型核心能力、提升算力利用率与成本效率、强化大规模并行处理能力、构建更灵活的资源管理机制等关键技术上深度优化。

此外,商汤还在全国率先完成了华为昇腾910C 384的超节点全面适配。

今年7月,商汤联合华为、海光、寒武纪、沐曦、摩尔线程、库帕思等十余家国产生态伙伴,共同发布“商汤大装置算力Mall”,目标帮助客户能低成本获取高性能的国产AI算力芯片。同时,针对国产芯片普遍存在的算力资源碎片化、不同厂商芯片调度复杂、跨域训练稳定性不足等共性难题,商汤还与上海人工智能实验室发布DeepLink异构混合调度方案,以帮助国产算力不仅“可用”,还努力做到“好用”。



让全球爱上“中国AI创新”

在商汤“三位一体”战略中,大装置是基础设施,大模型实现AI产品化,应用则是将AI落地到千行百业的具体场景。大装置从底层支持模型和应用创新,模型和应用通过市场反馈促进大装置优化。

今年上半年,一个名为LightX2V的开源项目及其推出的视频生成模型,在国外AI设计社区ComfyUI上走红,累计下载量超过350万次。海外开发者在Huggingface、GitHub 、Reddit的论坛上热议讨论。一位国外网友在得知LightX2V即将上传时,激动发帖表示:"不睡了,坐等更新!"

LightX2V是商汤与北京航空航天大学联合研发的实时视频生成推理框架。在设计时,LightX2V追求低成本、强实时的视频生成效果,采用了DiT蒸馏加速、轻量化 VAE、稀疏注意力等优化创新技术,能做到四步出片。

Sora2、Runway、Pika同类模型通常需要用几分钟、甚至十几分钟生成一段15秒的视频,LightX2V只花5秒就能生成一段5秒的视频。速度更快的同时,对硬件要求更低,仅需8GB 显存与16GB内存,就能运行140亿参数模型生成480P/720P视频,并且在算力芯片上不再局限于英伟达系列的高端AI GPU,兼容适配多款国产芯片。

将LightX2V与商汤自研AI 视频生成智能体Seko结合到一起,将彻底释放内容制作者“一人剧组”的生产力。最新发布的Seko 2.0 支持100集以内剧本的连续创作,内置的两项关键技术SekoIDX破解多剧集、跨分镜角色的一致性难题,SekoTalk攻克多人对口型难题,实现自然音画同步。目前在漫剧和短剧领域,Seko制作的真人短剧《婉心计》登顶抖音 AI 短剧榜第一。

除Seko与LightX2V外,商汤另一个开源的多模态模型架构 NEO也吸引了全球开发者的关注。

业内虽然之前已经有众多多模态大模型,但架构大都沿用“视觉编码器+投影器+语言模型”的模块结构,虽然实现了图像输入的兼容,但本质上仍以语言为中心,图像与语言的融合仅停留在数据层面。而NEO架构通过在注意力机制、位置编码和语义映射三个关键维度的底层创新,让模型天生具备了统一处理视觉与语言的能力。

NEO架构的创新也带来了极致的效率表现。测试结果显示,NEO架构仅需业界同等性能模型十分之一的图像数据,就能开发出对标竞争对手的视觉感知能力,在多项视觉理解任务中追平 Qwen2-VL、InternVL3 等顶尖多模态模型,在 MMMU、MMB、MMStar、SEED-I、POPE等多项公开权威评测中斩获高分。

商汤用一个个实践案例证明,降低AI使用门槛,通过开源项目加入全球开发者生态,能让中国AI影响力渗透到更多国家和地区。

国产化不是打造封闭系统

在中国AI崛起的道路上,国产化的本质不是打造封闭系统,而是要更多国产厂商参与加入建设生态。只有拥有国产化生态,中国AI才算真正在全球独立拥有一席之地。

商汤的国产化路线也从来不是一家公司在单打独斗,而是长期坚持对外开放合作。

国产芯片厂一直是商汤科技重要的合作同盟,华为昇腾、寒武纪、本月A股科创板上市的两家国产芯片公司摩尔线程、沐曦都是这个同盟里的重要成员。

以沐曦为例,商汤与其的合作不仅停留在产品采购与技术支持的层面,而是从战略层面达成了长期稳定的合作协议。产品技术层面,双方形成了底层技术开放共建共享的模式,共同开展技术深度适配、产品解决方案联合开发以及软硬件协同开发等工作。商业化落地层面,商汤与沐曦通过技术深度适配,确保了沐曦GPU在商汤大装置中的高效运行,两家公司还联合开发了一体机、平台适配、模型适配等多款产品解决方案,满足了不同行业客户的多样化需求。

前两年,高端芯片一卡难求,国产化的目标就是解决这样的风险。商汤与多家国产AI芯片企业深度合作,共同攻克“卡脖子”技术,实现算力自主可控,推动了中国AI算力的自主可控与产业发展,形成“技术互补、资源共享、场景互哺”的合作生态,也可减少市场对供应链短缺的担忧。

除了芯片厂外,商汤的合作同盟还在不断加入新成员,数据厂商、AI公司等等。反过来,与国产同盟建立的国产化生态也在创造更多可能性。例如商汤和记忆张量公司合作,攻克了GPU硬件架构适配难度远高于NPU的行业难题,实现了Prefill-Decoding分离(预填充-解码分离)技术在国产 GPU 上单卡并发效率提升 20%、吞吐量增长 75% 的亮眼成绩,把推理性价比大幅提升150%。

生态无法一天建成,国产化是一条要花很长时间走的路,但路的尽头方向明确,商汤已经出发走在前面,接下来会有更多同行者加入。