发布日期:2025-04-08 12:49 点击次数:117
3 月 26 日,商汤发布 2024 年全年功绩财报。2024 年,商汤集团的总体收入同比增长 10.8%,达到 37.7 亿元东谈主民币;其中,生成式 AI 收入防碍 24.0 亿元东谈主民币,同比增长 103.1%汉服 足交,这是生成式 AI 连气儿两年保抓三位数增速,已成为集团最伟业务。
大模子面世两年多时刻以来,从前期的一味追求大模子 Scaling Law,到如今算力效率、考验转推理,愚弄落地等被接连质疑,大模子如故全面来到新的发展阶段。
这是产业徐徐熟习的象征,但相似也在堆叠算力除外,对工程技巧以及场景协同才调提议了更高的条款。
在广阔传统大模子厂商除外,算作第一代" AI 原生"企业,商汤在 AI 基础形式上的干涉早于几年前便运转布局,而后计谋升级为"大装配 - 大模子 - 愚弄"的三位一体中枢境谋,而这一计谋正裸泄露其在 AI 产业的前瞻性。
"大装配"是指商汤的 AI 基础形式,为大模子提供遒劲的算力相沿,大模子驱动技巧翻新,愚弄端推动 AI 营业化落地——往日三年,商汤如故变成了"大装配 - 大模子 - 愚弄"三者协同的良性生态闭环,赋能千行百业。
咱们看到的是,历经过屡次技巧周期转化,商汤的技巧积淀正迎来爆发。
01 有算力、懂算力
2024 年 5 月,国内巨擘大模子测评机构 SuperCLUE 榜单出炉。商汤"日日新 5.0 " ( SenseChat V5 ) 的华文基准测评适度排行第一,以总分 80.03 分的收货刷新国内最佳收货,何况在华文详细收货上杰出 GPT-4 Turbo,这是国内大模子初次在 SuperCLUE 华文基准测试中杰出 GPT-4 Turbo 已毕登顶。
之是以或者斩获如斯收货,与商汤在 AI 基础形式上的提早布局至关进攻。
无人不晓,2024 年以来,寰宇智算中心的建立高速鼓励。从考验到推理,算力的资源属性愈发裸露,而且阛阓仍濒临算力资源漫步且措施不长入、使用起来效率不高的问题。
商汤恰是针对这一痛点,布局算力运营,将不同措施的卡贯穿起来,适配不同需求,兴隆不同类型的客户。
商汤科技董事长兼 CEO 徐立以为,一些科技巨头的重点在于我方的生态,包括自研芯片和云平台等,但当下 AI 范围要霸占先机,什么资源更快更好用就先用起来,不局限于一家的家具和平台,"商汤提供的基础做事更迫临 AI 发展近况。"
往日三年,商汤抓续干涉建立 AIDC 基础形式。据悉汉服 足交,商汤自抓的寰宇首个 5A 级智算中心——上海临港 AIDC,通过运营模式将算力限度进步至了 23,000PetaFlops。
通过与大模子迭代的聚首调优,商汤大装配的目的是成为"最懂大模子的 AI 基础形式",不仅做事于日日新大模子的考验与推理,还做事于包括互联网、金融、动力等熟习行业,还拓展性做事了具身智能、AIGC、AI4S(AI For Science)等高潜行业的客户。
徐立曾暗示,商汤是最懂模子的算力做事商,最懂算力的模子做事商。
02 三位一体
算力仅仅生态其中一环。大模子产业或者高效运转,还需要靠高下流协同发力。
"今天东谈主工智能的营业模式岂论是考验模子,照旧用模子对外做事,内容真谛上都是在忽地资源,付的是资源的用度。整个的营业模式临了都和预计打算资源忽地划了一个等号,等于通过‘三位一体’,把资源以最有用的方式整合使用起来。"徐立暗示。
"三位一体"是 2024 年 10 月商汤竖立的计谋标的,是商汤以大装配算作 AI 基础形式为底座,已毕"大装配 - 大模子 - 愚弄"三位一体、聚首优化的计谋。
算力与模子的双向优化,进一步进步了大模子的考验和推理效率。在进步考验效率方面,商汤通过接收自动化多维并行策略显耀进步了考验效率,何况已毕了 FP8 羼杂精度考验,非常是对雷同于 DeepSeek 的优秀第三方开源模子,大装配作念到高于官方论述的考验效率,变成行业标杆。
在进步推理效率方面,商汤的推理系统进行低比特量化推理,支抓开源 vLLM 及自研 lightLLM 双推理引擎,以 DeepSeek R1 为例,商汤的推理糊涂性能比业界头部厂商高 15% 以上。通过模子蒸馏技巧、键值缓存、PD(Prefill-decode)区别、多模态信息压缩等技巧,商汤在基本保抓模子性能的前提下将推理本钱压低了一个数目级。
因此,即使是相似一个模子,在不同的算力底座上,会有皆备不同的考验及推理效率。
跟着向生成式 AI 演进的稳步鼓励,"三位一体"进一步整合了商汤的资源上风,使其在大模子时期的内卷竞争中打出各异化。
商汤科技日日新大模子重点打磨坐褥力器具与交互器具两个标的的愚弄与家具。坐褥力器具径直为企业办公、金融、政务等场景提高坐褥效率,以订单金额为代表的客户付费意愿较 2023 年增长 6 倍;交互器具通过 2B2C 的方式赋能业务伙伴,进步用户体验,兴隆智能随同、智能硬件交互、智能营销等多场景需求,月均用户使用量较 2023 年增长 8 倍。
日日新大模子在保抓跳跃的阛阓愚弄占有率和客户做事粘性的基础上,在模子技巧上永恒保抓跳跃的位置。2023 年 4 月商汤初次推出商汤日日新 SenseNova 大模子体系,至 2024 年 7 月完成 5 大版块迭代。其中,2024 年 7 月发布的日日新 5.5 版块在多模态才调上显耀进步,为国内首个对标 GPT-4o 的多模态及时交互大模子,已毕语音、视频息兵话模子的原生和会。值得期待的是,商汤日日新 6.0 将于 2025 年 4 月 10 日发布,性能预期对标 Gemini 2.0 Pro。
此外,基础形式搭建好后,商汤相似趁早布局愚弄。
03 为什么是原生和会多模态
生成式 AI 爆发后,多模态大模子早已成为东谈主们追求的标的。干系词,市面上许多愚弄中搏斗到的多模态模子并不可说是"皆备体"。
短篇情欲小说就像谷歌所以为的,唯有从新运转的多模态才能构建出杰出前代的先进模子。这意味着它天生地不错读取和输出不同模态内容,还具备遒劲的多模态推理才融合跨模态迁徙才调。
技巧上,这被称为"原生和会多模态技巧",被以为是 AI 畴昔发展的必由之路,亦然商汤当下重点干涉的商议范围。
与传统的多模态模子不同,商汤的技巧并非简便地将不同模态内容转化为谈话 token 输入,而是从数据层、模子架构层进行全历程和会,涵盖感知、想考到输出的完好过程。
在 2024 年群众 CVPR 大会上,商汤科技共有 50 篇论文入选,商议适度聚焦于视觉谈话基础模子,触及自动驾驶、机器东谈主等前沿范围。
商汤的多元化 AI 家具均已有所愚弄收效。据悉,现在商汤"小浣熊家眷"已为数十万用户提供数十亿次智能扶助做事。而商汤绝影在行业内也最先已毕了原生多模态大模子的车端部署。
在 AI 的新阶段,商汤前瞻性地布局了硬件基础形式和愚弄端,通过底层和表层的协同优化构建起了技巧壁垒。
在基础形式端,商汤自建 AI 数据中心(AIDC)和限度化研发做事,确保公司在传统基础形式厂商和 AI 原生公司中脱颖而出。在愚弄端,商汤领有全栈体系 AI 愚弄,磨灭行业庸碌,大模子聚焦于原生和会多模态发展。
不错料到汉服 足交,商汤的"储备"有望在 AI 愚弄爆发后为公司带来精深发展空间。
Powered by r级书屋狂师 @2013-2022 RSS地图 HTML地图
Copyright Powered by365站群 © 2013-2024