
后DeepSeek时代开启大模型淘汰赛,六小虎谁离场,谁坚守?

据多家媒体报道,百川智能联合创始人焦可、陈炜鹏出走,均将开启AI领域创业。大模型行业的竞争格局在DeepSeek的搅动下发生了巨大变化,行业淘汰赛开启,“六小虎”如何应对?
百川智能又有两名联合创始人出走,大模型淘汰赛已开始
3月17日,据财联社等多家媒体报道,大模型“六小虎”之一的百川智能出现创始团队变动,其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。
据悉,焦可计划向AI语音方向创业,正在寻求融资。陈炜鹏也在筹备创业,项目为AI Coding方向,并且在陆续接触一些投资人。
2024年底,百川智能的另一联合创始人洪涛也传出离职消息。洪涛2023年7月入职百川智能,在百川智能创立初期快速搭建了商业化团队,为百川智能商业化负责人。
市场认为三位联合创始人的出走或与技术方向分歧有关。百川智能创始人兼CEO王小川在2025年2月的访谈中明确表示,百川智能已从通用大模型转向医疗领域,其称“AI的尽头是生命科学”,拟将资源集中于AI医疗领域。有消息称,百川智能近期裁撤了金融业务团队,优化To B体系,明确聚焦医疗垂类大模型。
回顾历史,2022年11月ChatGPT横空出世,拉开“百模大战”序幕。大模型“六小虎”(智谱、MiniMax、月之暗面、零一万物、百川智能、阶跃星辰)多在这一时间点附近成立。
其中,百川智能成立于2023年4月10日,成立不到百天便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型,且在多个权威评测榜单均名列前茅,下载量突破百万。
但一帆风顺不是创业主旋律,世界瞬息万变。2025年初,市场迎来“DeepSeek时刻”,大模型头部企业纷纷迎接大考。截至2025年3月,百川智能已经近九个月没有更新大模型版本。
鸿博股份(002229.SZ)于3月13日披露的一则公告也侧面反映出百川智能已作出战略调整。公告显示,受不可抗力因素影响,鸿博股份全资子公司英博数科与百川智能解除了《云服务协议》。该协议于2023年12月4日签订,约定英博数科向百川智能提供一定规模的智算服务器所有的算力和资源以及配套软件、应用,以及技术服务,合同期限为三年(2024年1月30日至2027年1月31日),合同总金额约13.82亿元。
值得注意的是,明确放弃通用大模型继续演进的“六小虎”成员除了百川智能之外,还有零一万物。
零一万物CEO李开复2025年1月7日回应媒体称,只有大厂能够“烧得起”超大模型,零一万物2024年以来的目标是做小参数、适中的行业模型。
事实上,自2024年5月起,零一万物就在为2025年的大模型淘汰赛做调整。公司放弃了训练原定万亿参数的超大模型Yi-X-Large,转为训练更轻量化的MoE(混合专家)模型Yi-Lightning。
2025年1月,零一万物表示,预训练和Infra团队中愿意继续训练超大参数模型的成员已加入零一万物和阿里云成立的“产业大模型联合实验室”。零一万物将正式聚焦轻量化模型,以产业大模型发力商业落地。
次月,零一万物被曝内部发生多处变动,如计划拆分数字人业务。零一万物回应称,会根据产品市场匹配度对项目进行快速调整,包括加强投资部分业务、鼓励有商业化潜力的项目进行独立融资,也包括关停部分项目。
3月17日,零一万物成为“六小虎”中第一家拥抱“DeepSeek时刻”的厂商。公司对外发布万智企业大模型一站式平台,并宣布可提供企业级DeepSeek部署定制解决方案。这是零一万物To B智能化转型路上的一项深化措施,零一万物表示,2025年会是大模型To B应用的爆发年,大模型会从炫技走向新质生产力。
格局未定,何妨煮酒论英雄
在DeepSeek冲击、大厂强势的情况下,百川智能、零一万物已另寻出路,但其余四家“六小虎”成员仍在尽力突围。
面对新一轮的开源之战,智谱预告2025年将是智谱开源年,很快会发布全新大模型并将其开源,包括基座模型、推理模型、多模态模型、Agent(智能体)等。
2025年3月14日,智谱与上海张江(集团)有限公司签署合作协议,于当日正式发布的模力社区—智谱大模型MaaS平台将依托智谱GLM大模型技术为模力社区入驻企业提供专属“模型池”。
3月4日,智谱发布“智谱2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4。CogView4具备较强的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,能够生成在给定范围内的任意分辨率图像,同时具备较强的文字生成能力。在DPG-Bench基准测试中,CogView4的综合评分排名第一,在开源文生图模型中达到SOTA(State-of-the-art,指通过实验证明优于现有所有方案的方法或模型)。
2月11日,智谱官宣了与三星的合作,双方将让Agentic GLM(智谱专为手机研发的系统级大模型)登陆到三星最新款手机Galaxy S25系列上。
此外,智能超参数发布的《中国大模型中标项目监测报告(2024)》显示,2024年中国通用大模型厂商中标排行榜中,智谱位于第三位,中标的数量为32个,中标金额约1.29亿元。
阶跃星辰目前已公开发布十余款模型,包含千亿参数、万亿参数语言类模型,强化学习范式的推理性模型,多模态领域的图像理解生成模型,视频理解生成模型,以及语音模型等。其创始人姜大昕表示:“我们正朝着实现AGI的目标稳步前进,目前已进入Agent的发展阶段。”
2025年3月12日,阶跃星辰与智元机器人正式签署战略合作协议。双方将利用各自优势技术及专业能力,进行具身智能与大模型的共同创新。
2月22日,在上海举办的2025全球开发者先锋大会开幕式上,姜大昕透露将在今年3月继续开源图生视频模型。
2月21日,在阶跃星辰举办的首届Step UP生态开放日上,阶跃星辰集中展示了大模型技术赋能下的丰富应用场景与创新体验,重点阐释了在智能终端Agent领域的布局,并宣布与吉利汽车(00175.HK)、OPPO等企业深化合作关系。
2月18日,阶跃星辰开源两款模型,分别为业内首款产品级的开源语音交互模型Step-Audio和文生视频Step-Video,在官宣开源4天后,生态接入数就超20个,包括阿里云、天翼云、联通云、移动云等云厂商以及国产芯片企业,TCL、欢瑞世纪(000892.SZ)等产业方均纷纷响应。
据方正证券研报,月之暗面和MiniMax的战略优先级是C端产品和应用。相比于B端,C端用户基数大,会带来更高的推理成本,且付费转化周期更长,需要长期培养用户使用习惯。
月之暗面2024年在C端市场通过大量投流实现拉新,其中Kimi在10月的投放量飙升,20天投出1.1亿元,接近其整个第三季度的总和。但自2025年2月,月之暗面开始大幅削减产品投放预算,暂停多个安卓渠道及第三方广告合作,内部解释为“外部竞争压力与战略调整”所致。有消息称,此次调整或与DeepSeek的快速崛起有关,团队计划重新训练基础模型,并探索应用层创新。
2025年2月23日,月之暗面发布开源模型Moonlight,包含30亿/160亿参数版本,基于Muon技术框架,训练数据量达5.7万亿token,在低浮点运算下实现性能突破。
2月18日,月之暗面宣布推出一款新模型Kimi Latest,它将对标Kimi智能助手当前使用的模型,随智能助手产品更新而同步升级(模型名称始终不变),旨在为开发者和企业用户提供更强大、更稳定的AI生成能力。
2025年2月,MiniMax副总裁刘华在2025全球开发者先锋大会上表示,未来MiniMax将打造多种模态的开源生态,大模型研发也将依赖于高度组织化、精细化的研发团队。“在方向上,稠密模型已经被唾弃,而是在稀疏架构上研究。接下来,MiniMax会在线性注意力机制或者是非Transformer架构上发力。”
此前,MiniMax在2025年1月发布并开源新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,在综合性能比肩GPT-4o、Claude-3.5等海外头部大模型的基础上,能高效处理高达400万token的输入,可输入长度是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。