OpenAI 2025发布日深度解析:ChatGPT革新如何重塑AI应用生态
国内人工智能领域的竞争态势已广为人知,例如飞书今日举办发布会,钉钉明日便可能紧随其后推出类似功能。然而,国际市场的角逐更为白热化。首当其冲的是谷歌,其基座模型Gemini结合图像视频套件(如Nano Banana、Veo3)展示了令人瞩目的技术突破。
与此同时,Meta也充分享受到人工智能发展带来的巨大红利:
| 日期 | 事件 | Meta 当日/次日股价反应¹ |
|---|---|---|
| 2023‑02‑24 | Llama‑1 首次对学术界开放 | 2023 全年累计 ≈ +150% |
| 2023‑07‑18 | Llama‑2 商用开源 | 当周连续收涨 |
| 2024‑02‑02 | Q4 业绩电话会重点强调 AI / Llama | +20.3%(单日) |
| 2024‑04‑18 | Llama‑3 (8B/70B) 发布 | 盘后 +1.8%;次日 +2% |
| 2024‑04‑25 | 宣布“数百亿”AI CapEx 计划 | ‑13%(单日) |
| 2025‑01‑27 | DeepSeek‑R1 免费发布,下载量反超 ChatGPT | ‑≈4%(Nasdaq 同跌 ‑3.1%) |
| 2025‑07‑19 | Zuckerberg 再提“数千亿美元”AI 投资,Llama‑4 训练中 | YTD ≈ +20% |
然而,自DeepSeek开源以来,Llama在开源领域的领先地位变得不再稳固,甚至后续还曝出数据造假的丑闻。

为突破技术瓶颈,Meta几乎紧盯着OpenAI进行人才挖角:今年六月,Meta宣布组建超级智能实验室(Superintelligence Labs),计划投入数十亿美元资金吸引顶尖研究人员。该实验室旨在组建一支规模精干但人才密度极高的团队。

综上所述,无论是谷歌的强势技术反超,还是Meta的高薪挖角策略,亦或是国内DeepSeek、QWen等公司的迅猛追赶,都让昔日的AI霸主感到压力重重。因此,OpenAI开始连续升级模型,但近期推出的GPT-5并未带来预期中的惊艳表现。
眼见基座模型难以拉开显著差距,OpenAI不再掩饰其战略转向,开始全力聚焦应用侧创新。于是在10月7日凌晨,OpenAI年度发布会OpenAI Dev Day 2025正式开幕。整体而言,个人认为可用**“缺乏突破性进展”**来形容此次发布会。

按照山姆·奥特曼的阐述,本次发布会的核心在于如何帮助人们更高效地利用AI进行创造:
- App inside ChatGPT:采用“应用商店”模式,吸引大量开发者入驻平台;
- Agent Kit:可类比为字节跳动体系的Coze全家桶式开发工具;
- Codex 正式版:为追赶Claude Code而推出的编程助手;
- 多模态能力:发布了gpt-image-1-mini(图像处理模型)、GPT-5 Pro、Sora、Real-Time Mini等API接口。
可以看出,当基座模型竞争陷入僵局时,OpenAI开始转向更易实现的领域,例如通过功能组合打造应用生态。实际上,上述所有功能要素或多或少都已出现在市场上,且没有哪一项是OpenAI具备绝对优势的。OpenAI此次更像是一位优秀的技术路线整合者,系统性地展示了其应用生态蓝图。
LLM操作系统:ChatGPT内置应用商店的战略布局
Apps inside ChatGPT标志着OpenAI正式推出自家的App SDK。这一概念并非首次出现,早在之前的红杉资本会议上就有人提出:云计算时代的操作系统是微软,移动互联网时代是iOS/Android,而AI时代的操作系统将不再是传统软件,而是任务调度系统。
任务调度系统的典型代表包括近期备受关注的Manus以及正在进行变革的AI浏览器。
由于模型自身能力有限,需要各种插件扩展功能,于是MCP协议应运而生。目前应用较好的仍是各类开发平台或低代码平台,例如Dify、Coze等。
另一方面,LLM应用商店也非新鲜事物。如今ChatGPT向开发者开放,允许他们构建原生应用,其逻辑与App Store、微信小程序如出一辙,本质是一场生态与流量平台的游戏。
普通开发者期望平台提供更多流量支持,平台则希望通过接入更多开发者来增强自身功能,最终吸引更大流量。在此背景下,OpenAI SDK自然诞生。
了解其诞生背景后,OpenAI SDK提供的各项功能便不难预测,包括数据连接、事件触发、交互卡片等。
具体案例方面,OpenAI挑选了几个典型场景进行展示:在线教育平台、设计工具、房地产信息服务等。

最终,有流量的地方就可能出现灰色产业(GEO),一旦被灰色产业渗透便难以维持健康生态。平台化与商业化虽是必然选择,但如何维护良性生态,防止灰色产业肆意牟利,是OpenAI必须提前考量的问题。
AgentKit:OpenAI的低代码平台挑战与局限
AgentKit是一套内置於OpenAI平台的完整构建模块,旨在帮助开发者以更少时间和精力完成从原型设计到生产部署的全流程。它包含三大核心组件:
- Agent Builder(智能体构建器):可视化工作流设计工具,主打拖拽式操作;
- ChatKit(聊天工具包):主要提供UI语法糖及减少工作量的集成功能;
- Evals for Agents(智能体评估):用于衡量智能体性能,但实际用途尚不明确。
坦率地说,AgentKit的出现令人颇为意外,因为当前市场上优秀的智能体平台已层出不穷,例如Dify、Coze、n8n、FastGPT等。
无论如何包装,AgentKit都难以摆脱一个基本事实:它是一个低代码平台。而低代码平台的生存前提有两点:
第一,平台本身正确且易用;第二,能为开发者提供充足的流量分发。
所谓正确易用主要取决于生态建设与投入程度。如果OpenAI计划在此领域持续发力并将其作为战略组成部分,就必须清晰定义目标用户画像。例如飞书和钉钉就非常明确,它们旨在争夺AI办公市场的流量入口。
但如果AI办公是OpenAI的战略方向,那么AgentKit的设计出发点可能存在偏差。
因为无论飞书还是钉钉,其核心都聚焦於AI表格。从更本质的企业视角来看,许多公司迫切需要一套支持多人分散录入、集中汇总、统一分析、按权限查询的轻量级系统。这套系统意味着AI办公流量的关键入口,是一块极具吸引力的市场蛋糕。
以往Excel、OA系统、低代码平台都在争夺这份份额,如今竞争尤为激烈的是飞书多维表格与钉钉AI表格。更准确地说,许多公司正以Coze、Dify为外壳,实质推广AI表格解决方案。
然而,为什么AI表格成为核心?因为在实践过程中,实际业务部门往往对智能体的交互体验表示不满。他们并不青睐聊天式操作,甚至有所排斥。HR、财务等人员已习惯Excel的操作逻辑,能直接从表格中快速提取关键数据,且这些操作流程相对固定。对他们而言,Excel才是真正的工作台。
综上,如果OpenAI的目标是AI办公市场,那么它应同步推出强大的表格应用;如果不是,AgentKit这类低代码平台的存在意义便令人困惑。至少在我接触的圈子中,需要生产级智能体的团队通常会选择自主编码开发…
此外,OpenAI若想涉足此领域,还缺乏自身的即时通讯生态支撑。因此,AgentKit的推出显得尤为微妙。
Codex:自然语言编程时代的新竞争者
Codex的亮相最不令人意外,因为我们此前就已推断,无论是Coze还是多维表格,都只是低代码平台的一部分,其效率提升空间有限。
我们真正需要的并非低代码平台,而是加速迈入自然语言编程时代。得益于GitHub的优质代码语料,Cursor、Claude Code已为开发者提供初步启示。
於是OpenAI再次展现出全面布局的风格,略显突然地“背刺”了其紧密合作伙伴——核心功能完全依赖OpenAI模型的Cursor。
这可能会让Cursor团队感到措手不及,因为他们积累的算法数据大多蕴含於提示词中,而这些数据已完全被OpenAI掌握。作为基座模型供应商,若直接与应用层公司竞争,难免引发行业争议。
我原本预期OpenAI可能会通过投资或战略合作方式,与Cursor协同对抗Claude Code,但它最终选择了独立发展。这或许也是市场竞争的常态体现。
多模态技术:视频与图像AI的突破与挑战
除上述内容外,发布会还展示了多模态技术进展,其中近期热议且敏感的Sora2尤为值得关注。
不久前,Nano Banana引发广泛关注,国庆期间Sora App也迅速走红,这表明在国内市场,图像与视频类AI应用更受欢迎,因其商业变现路径更为清晰。
实际上,Sora2的爆发并非偶然,只能说OpenAI在此领域投入更为果断。因为不久之前,谷歌的视频图像全家桶同样表现出色。当时谷歌发布三款面向创作者的AI工具:
- Flow:实现从脚本、分镜、配乐到配音的全流程自动化;
- Veo 3:让AI视频摆脱“无声时代”,支持原生音轨与物理细节模拟;
- Imagen 4:图生图模型,能在2K分辨率下保持Logo与文字清晰度。
这三者组合,犹如为创作者配备了导演、摄影师、视觉总监的完整团队:

因此,甚至有朋友鼓励我尝试AI短剧创作:

但为什么谷歌套件未迅速走红,而后来的Nano Banana却很快火爆?答案很简单:使用门槛与价格因素。
如果一个工具门槛过高,通常意味着其尚未准备就绪,可能是定价问题或功能完整性不足。于是五个月后,OpenAI反而在此领域夺得先机,当然也得益於其生成效果确实逼真。只不过这种领先优势可能难以持久,预计最多维持两个月左右…
然而,该领域最大的挑战可能仍在於监管与版权问题。视频内容的维权难度较文字作品更为复杂。
结语:OpenAI的战略转向与行业反思
近期,OpenAI在基座模型能力侧表现乏力,于是他们开始选择相对容易的路径推进。这不禁让人想起两年多前的百度。
当时百度的文心大模型本身并未达到顶尖水平,但其销售策略已全面铺开,在国内大量承接企业级业务(我们当时正是医疗领域的潜在合作方之一)。
最终结果众所周知:基座模型未能做好的团队,在企业服务市场同样难以取得突出成绩。
在此需要向行业老大哥OpenAI提出建议:应用层确实是AI的未来,但那是开发者与生态伙伴的未来。OpenAI或许应专注於基座模型的研发,将应用创新交给更擅长的公司完成,避免过度分散精力。毕竟
“注意力就是一切”的时代已然过去,如今技术颠覆可能发生在短短数月甚至几周之内…