普通视图

发现新文章,点击刷新页面。
今天 — 2025年12月23日首页

刚刚,钉钉掀桌子!狠人无招狂甩 20+AI 新品,AI 工作操作系统来了

作者 莫崇宇
2025年12月23日 12:39

2026 年,很可能会被后来的人反复提起,作为人类工作方式分水岭的重要一年。

在今年的 OpenAI 开发者大会上, Sam Altman 给出了一个判断:第一批真正意义上的 AI Agent,会开始进入企业体系,像「新工种」一样参与产出。人的职责被压缩为决策与指令,执行层则交给机器完成。

但一个 chatbot 聊天框,显然还承载不起这种野心。

OpenAI 希望用 Apps SDK 把 ChatGPT 变成新的 OS ,试图让所有应用都不再运行于 Windows 或 macOS 上,而是直接「寄生」在 ChatGPT 里。

顶尖 AI 公司在打造操作系统(OS),本质上是为了更好调动智能资源。

回看移动互联网的崛起,光有触摸屏远远不够,iOS 和 Android 这样的操作系统才是关键。AI 能力如果真的要成为企业的生产力,需要一个能统一调度的 AIOS,让零散的模型、工具和流程像安装 App 一样自然运转。

这种对未来计算架构的终极构想,今天在国内有了更落地的答案。

就在刚刚,AI 钉钉 1.1 新品发布暨生态大会在杭州召开,代号为「木兰」的 AI 钉钉 1.1 版本正式发布。

如果只看功能更新,很容易被淹没在产品名里;但如果抓住核心,它的逻辑其实格外清晰:钉钉要成为一个 Agent OS,像 Windows、macOS 那样,给所有 Agent 提供一个统一运行、调度和协作的底层系统。

APPSO 在现场给大家快速梳理了这场发布会的要点:

  1. 钉钉 Agent OS:全球首个为 AI 打造的工作智能操作系统,让 AI 从问答走向干活。
  2. 钉钉 ONE:在这个界面上,工作被 AI 以信息流的形式推送给人,人也可以选择全球所有模型为自己工作。
  3. 企业 AI 硬件 Real: 全球首款专为 Agent 打造的企业级 AI 硬件,提供运行物理环境。
  4. 四大 AI 单品升级:会议记录搭子 AI 听记、AI 录音卡 DingTalk A1、AI 表格、AI 搜问。
  5. 以及基于 Agent OS 打造的一系列商业可交付 Agent,如差旅 Agent、招聘 Agent、研发 Agent、AI 印,以及面向制造业的质量 Agent、订单 Agent,面向门店餐饮行业的销售 Agent、店长 Agent……
  6. 覆盖从模型训练、Agent 开发、通用 Agent、行业 AI 解决方案、用户交互方方面面,堪称新品轰炸!

Agent OS ,为 AI 打造的操作系统

这两年,打工人普遍患上了一种「技术性精神分裂」:网上的 AI 已经聪明到能拿诺贝尔奖了,自己手头的工作却还在用 Ctrl+C 和 Ctrl+V 缝缝补补。

文档是一个孤岛,日程又是另一个孤岛,打工人的一天,基本就是在各种应用功能的缝隙里「仰卧起坐」。要想让 AI 真的接管工作,光靠在聊天框里敲几个提示词是没用的,必须把地基重打一遍。

钉钉这次推出的 Agent OS,就是那个新的地基。或者说 AI 时代的钉钉就是 Agent OS。

作为全球首个为 AI 打造的工作智能操作系统,钉钉没在旧系统上小修小补,而是直接把桌子掀了,给 AI 打造了一层新的工作操作系统,重新做一个新的钉钉,让所有应用和智能体都跑在这上面,被统一调度、统一协同。

怎么理解 Agent OS?可以理解为 AI 时代的 Windows。所以,Windows 操作系统有什么,Agent OS 对应就有什么。

在架构上,它底层由钉钉开放平台提供丰富的 AI 模型及 MCP(Model Context Protocol)能力支撑,再通过钉钉企业 AI 平台(DEAP)、模型训练平台联通了整个软硬件生态,开发者、企业都可以在其上开发 Agent、训练模型,也可以进行模型、Agent 的资源管理、运维。

再往上,其提供了桌面「钉钉 ONE」、Agent 的运行环境「DingTalk Real」、Agent 的指挥官「悟空」。

Gartner 预测,到 2028 年至少 15% 的日常工作决策将通过 Agentic AI 自动完成。钉钉 Agent OS 正是这一趋势的践行者。而为了调度这些 Agent,钉钉还推出了名为「悟空」的通用 Agent。

「悟空」不仅能听懂人话,更具备了规划(Planning)、执行(Acting)和自反思(Learning)的能力。

它就像是一个不知疲倦的个人秘书,你只需要说「帮我安排一次去英国的差旅」,它就会自动拆解意图,调用日历、订票 Agent、酒店 Agent,甚至协同企业自建的专属 Agent,跑通一整条复杂的业务流。

把执行的繁琐留给 AI ,把决策的尊严还给人类。当我们从繁琐的点击操作中解脱,才能把大脑更多内存用在关键的决策和思考上。

钉钉 ONE,消灭一个个功能窗口,给 AI 一个统一桌面

过去的钉钉受困于聊天软件的形态,而钉钉 ONE 彻底重构了交互界面。这可能是用户感知最强烈的变化,新的桌面不再是消息列表的堆叠,而是一个由 AI 驱动的信息流。

首先是能搜、能问、能干的「AI 搜问」。

在全新的 Agent OS 架构中,AI 搜问承担着「指挥官」的核心角色, 它是用户指挥 AI 工作的统一入口, 也是整个 Agent 体系的中枢大脑。

它融合了全球大模型的能力与企业本地知识库,用户的一次提问,既能连接外部世界的知识,也能穿透内部数据的壁垒,甚至直接驱动「悟空」去执行任务。

大模型问答上,AI 搜问还首创三项能力:多模型融合与交叉验证降低幻觉、专有脱敏加解密的安全模式保障数据不泄露、基于真实业务数据与知识图谱推理的事实问答,支撑企业洞察与决策。

AI 钉钉 1.1 发布后,AI 搜问将沉淀为钉钉全局基础 AI 服务,覆盖 IM、AI 表格、AI 听记等场景,自动感知上下文实现统一问答与跨内容检索;同时上线浏览器插件,支持网页划词/点击提问,并可一键把页面信息转为 AI 表格沉淀,实现「钉钉内外随处可问」。

其次是「Agent 主动服务」的新范式。底部的应用变成了可以左右滑动的智能卡片(Agent widgets)。

  • 消息 Agent 成了你的秘书,自动折叠噪音,只提醒真正重要的事。
  • 日程 Agent 全程托管时间,从查闲忙到订会议室,全流程无人值守。
  • 发现-7 新板块则像一个全球情报雷达,利用专门训练的 Agent 实时扫描全球的新产品、新技术与新风险,并以短视频形式呈现在你面前。

你不再是去找工具,而是工具主动来找你。这不仅仅是 UI 的革新,这是工作权的交接——AI 负责处理信息噪音,人负责最终决策。

DingTalk Real,给 AI 一个物理的家

DingTalk Real 是全球首款专为 Agent 打造的企业级 AI 硬件,也是本次发布会上最有趣,也最体现钉钉「To B」基因的部分。

它是 Agent OS 的运行环境,有了这个「盒子」,员工不管在哪,都能远程唤起 AI,安全地访问公司内网和本地文件,比如全网比价订酒店、写深度分析报告。真正实现「人在家中坐,工作 AI 帮你办」。

很多人会问,云端那么强大,为什么还需要一个本地盒子?答案在于 DingTalk Real 解决了两个核心痛点:

  • 数据主权与安全: 企业不敢把财务数据、内网权限完全交给公有云。Real 作为一个部署在企业防火墙内的「安全主机」,让 Agent 可以在隔离的环境中通过浏览器、PC 软件去操作真实的业务系统,既能干活,又不泄密。
  • 永不掉线: 这是一个 7×24 小时的数字员工,能够访问最实时的数据,当然它也可以在深夜依然可以监控市场动态、整合信息,等待第二天早晨向你汇报。

从这个角度看,Real 实际上是在啃企业数字化转型中最硬的那块骨头:让 AI 不止停留在会说话,而是真能安全地、持续地、在组织体系内把事情办了。

硅谷想做的 AI 操作系统,怎么钉钉先做了出来

在硅谷,AI 操作系统几乎是明牌方向。

微软把 Copilot 塞进 Office,Google 把 Gemini 嵌进 Workspace,创业公司则试图从浏览器和桌面重来一遍。但真正复杂的企业工作,藏在审批流、权限、内网系统和行业软件里。

钉钉的不同在于,它原本就是企业的工作底座。Agent OS 不是叠加在工具之上,而是直接生长在组织结构和业务流程里。

别再 Ctrl+F 了,AI 听记用一句话帮你找回关键信息

注意,AI 听记迎来重大升级,能够根据你的身份标签(学生、销售、项目经理)自动贴合最合适的总结模板,像一个懂行的速记员,主动帮你归纳重点。

它不仅能听,还能看。

比如你在课堂或会议上拍一张板书,它能自动识别上面的公式或流程图,并插入到语音记录中。你甚至不需要去翻看冗长的记录,直接问它上周客户对价格有什么异议?它就能从历史录音库中把答案翻出来。

AI 表格:普通人也能写代码,才是 AI 该有的温柔

AI 表格可能是打工人最值得关注的产品。

全新语音交互功能「念一念」支持语音输入自动转换为文字,并由 AI 智能识别字段类型,实现数据的结构化录入。

在蒙牛的牧场里,那些戴着厚手套、打字困难的巡查大叔,现在只需要对着手机说一句「牛舍温度正常」,AI 表格就能自动识别并填入对应字段。

业内首创的「万能贴」功能,能够把乱七八糟的截图、网页复制进去,两秒钟变结构化数据。更夸张的是「AI APP」模式,拍一张手绘草图,AI 直接给你生成一个带仪表盘、带权限管理的完整 CRM 系统。

DingTalk A1:不取代手机,只做最好的外挂

硬件必须服务于具体的、高频的、且手机无法完美解决的场景。作为双 11 的销量冠军,DingTalk A1 并没有试图取代手机,而是选择了做手机的「外挂」。

DingTalk A1 专注于会议记录这一痛点,提供了一键录音和超长续航等功能。销售通话录音更是直接进入 CRM 系统分析意图,HR 面试纪要自动生成。不可否认,这是一次彻头彻尾的实用主义胜利。

如果说前面的产品升级是钉钉自己的「内功修炼」,那么基于 Agent OS 打造的一系列商业可交付 Agent,比如差旅 Agent、招聘 Agent、研发 Agent 和 AI 印等则展现了这个操作系统真正的生态爆发力。

除了上述产品,钉钉还顺手发布了一系列行业大杀器,并展示了其构建开放生态的决心。

钉钉 CEO 无招在发布会上宣布,钉钉已建成全球最大的企业级 MCP 广场和 AI 助理市场。目前,平台上已包含数千个企业常用 MCP 能力和数十个开箱即用的 AI 助理。

  • 制造业与零售业: 针对制造业,它有能看懂订单截图的「订单 Agent」;针对零售业,它有一个能盯着监控分析客流、甚至能去大众点评看差评并提出整改意见的「店长 Agent」。
  • 商业模式的共享: 钉钉为入驻的生态伙伴提供了「算粒分成」和「按效果付费订阅」等模式。这意味着,开发者不再是单纯卖软件,而是与平台一起共享 AI 时代的商业红利。

实际上,这次版本的代号「木兰」颇具深意。

作为古老的被子植物,木兰象征着生命形式从简单向复杂的必然进化。而在数字世界,AI 钉钉 1.1 正试图复刻这一过程:让孤立的 AI 功能,演化为一座万物互联、多 Agent 共生的热带雨林。

钉钉 Agent OS 的诞生,本质上是在提前抢占 AI 办公时代的「入口」。

无招团队的判断很毒辣:在搜索入口式微、操作系统逻辑被重写的当下,唯有主动跳进 AI 的洪流,将钉钉从一个聊天工具重塑为一个能够理解、规划并执行人类意图的「超级系统」,才是最忧解。

这恰恰呼应了 OpenAI 联创卡帕西(Andrej Karpathy)今年那场在 AI 圈刷屏的演讲中提到的观点:

LLM is becoming the OS. Not for your computer, but for your mind(LLM 正在变成一种操作系统——不是管理电脑的,而是管理思维的)。

也就是说,通过用自然语言取代复杂的软件菜单,进而重构人与工具的交互逻辑。

那么为什么 Agent OS 会率先诞生在办公场景中?

究其原因,办公场景天然就是一张被切得稀碎的任务网:人找人、表接表、会连会、审批套审批;每个环节都不复杂,但连起来就是一场令人窒息的消耗战。

Agent 若真要成为「工作入口」,它必须解决的不是会聊天,而是会办事。

于是我们便能进一步理解,钉钉为何如此激进加码 Agent OS:它不缺用户、不缺场景,更不缺流程,只缺一个足够「能跑」的智能体层,把那些看似琐碎的工作串起来,把关键任务节点推到人面前。

过去的我们被职场信息填得太满,喘不过气来。新版钉钉用 AI 重新分配时间与注意力,让人把精力收拢到关键决策与高价值产出上,为工作节奏重新腾出空间。

删繁就简,新一代工作的基本形态,正在钉钉中逐步显现。这是钉钉的 1.1 版本,也是工作本身的 2.0 时代。

作者;莫崇宇、李超凡

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天以前首页

GPT-5.2 翻车内幕曝光:技术团队没走「歪路」,但用户成了大冤种

作者 莫崇宇
2025年12月19日 17:26

OpenAI 的十周岁生日,过得不太体面。

在当天发布的 GPT-5.2 交出了一份完美答卷:它横扫许多基准测试的 SOTA,在数学和编程等竞赛场景中的表现堪称亮眼,也被官方描述为 AI「超级大脑」。

可到了社交网络,迎接它的不是掌声,而是用户的集体骂街。

在 X 和 Reddit 上,愤怒与失望几乎写在每一条评论里。人们又一次怀念起那个曾经的「白月光」GPT-4o:有人说 GPT-5.2 变得平淡、乏味、像被磨平了棱角;也有人讥讽它成了「把成年人当幼儿园小孩对待」的说教。

当舆论的炮火对准 OpenAI 及其 CEO Sam Altman(山姆·奥特曼),一个尖锐的问题摆在面前:为什么模型更「聪明」了,用户反而更不爱了?

更「聪明」的模型,为什么不讨喜了

The Information 今天凌晨的最新报道,扒出了内幕。

过去一年,OpenAI 内部曾奉行一条铁律:每一次模型的代际飞跃,都会伴随着用户量的爆发式增长,因为「变聪明」带来的体验升级是直观的。但现在,这条铁律失效了。

当然,模型在智能与科研计算领域的提升依旧显著。研究团队耗费数月打磨推理能力,让它能攻克更复杂的数学与科学难题,但对于大多数普通用户而言,这种感知微乎其微。

🔗 https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset

换句话说,智能的提升,并不天然等同于体验的提升。

普通用户很少需要一台「竞赛级大脑」,他们更多需要一个「日常好用的助手」。OpenAI 对 150 万次对话的大规模分析佐证了这一判断,用户的核心需求极其接地气:实用指导(29%)、信息查询(24%)以及写作(24%)等,而与编程任务相关的对话只有 4.2%。

于是矛盾就变得非常具体:当技术团队在实验室里狂卷数理化、狂卷基准测试时,用户在聊天框里只想要一句话解决问题——别绕、别教、别拖。

战线拉得过长是一大槽点。

今年大部分时间里,奥特曼同时启动了多个新项目:视频生成应用 Sora、音乐 AI、浏览器、AI Agent、硬件设备、机器人……摊子越铺越大,资源也被越分越碎。

这其实是科技巨头最常见的经典错误:核心阵地还没打稳,就急着开辟第二、第三战场。短期看是「全面开花」,长期看,贪多嚼不烂,乃兵家大忌——每一条战线都缺人、缺算力、缺产品打磨的耐心。

OpenAI 内部「研究优先」和「产品增长」之间的拉扯,在图像生成上体现得尤为明显:

即便 GPT-4o 的吉卜力风格在三月还短暂带动过 ChatGPT 的使用与用户增长,但 OpenAI 还是一度把图像模型的开发优先级往后放,等到 Nano Banana 口碑发酵后,OpenAI 又紧急回头补课,内部也因此爆发分歧——

奥特曼认定图像模型是用户增长的抓手,研究主管 Mark Chen 则更想把资源押在别的项目上。

另外,伴随着 Scaling Laws 边际效益递减,为了突破大模型的瓶颈,OpenAI 过去一年里押注了推理模型,超过 1000 人的研究团队将资源倾斜于此,导致对 ChatGPT 日常体验的优化被边缘化。

这种做法不仅分散了资源,甚至在年初的内测中出现了性能倒退——为了适配「聊天」场景,反而削弱了推理模型的纯粹性。虽然后来推出了「思考模式」和「深度研究」来分流、来补救,但用户使用率却很低,真正的日常对话体验并没有因此变得更讨喜。

除此之外,新旧模型之间也常出现兼容问题。

例如在发布 GPT-5 前,研究人员发现模型在集成进 ChatGPT 后在部分编程任务上表现变差——因为系统根据用户职业等个性化信息调整回答,结果反而干扰了模型理解,导致错误答案。

诚然,推理模型越来越强,但 ChatGPT 体验越来越拉胯。

当技术进步的方向和用户需求的方向开始分叉,谁会先妥协?答案显而易见。

Gemini 3 Pro 的强势发布,最终把 OpenAI 逼到了墙角,于是便有了奥特曼发布「红色警报」的经典名场面,要求 OpenAI 员工重新聚焦 ChatGPT,提高产品体验吸引力。

而在同一时间,OpenAI 应用负责人 Fidji Simo 也在个人博客中阐述 ChatGPT 的愿景,那就是从主要以文本为主的对话系统,转向能根据用户意图动态生成界面的全生成式 UI。

只是 Simo 也曾承认,公司本质仍以研究为中心,「产品本身并不是最终目标」。

从商业逻辑看,这句话其实很危险。

不同于 Anthropic 更偏向主攻 API 市场,OpenAI 的大头收入来自个人订阅。在消费市场,没有人会为企业的「终极理想」买单,用户只愿为当下的体验付费。这就好比餐厅大厨醉心于研发米其林料理,而大堂里的食客仅仅想要一碗热气腾腾的阳春面。

不过,如果你因此就断言 OpenAI 内部已经乱了阵脚,那可能低估了这家公司的韧性。

据彭博社援引 Mark Chen 的说法,「红色警报」并非新鲜事,而更像是一种战时状态的常态化管理工具。每当 OpenAI 需要集中火力攻克某一单一目标,或要求团队放下低优先级任务时,这种机制就会启动。

▲播客地址:https://x.com/Kantrowitz/status/2001790090641645940

奥特曼在最新的播客中,同样否认了拉响红色警报带来的过度焦虑。

「首先,所谓的『红色警报』,在我们看来其实是一种低风险、但非常必要的应对措施。」奥特曼坦言,「在潜在的竞争威胁出现时,保持一点『偏执』、并迅速做出反应,是件好事。」

他甚至提到了今年年初 DeepSeek 的崛起,认为那和现在的 Gemini 3 一样,都是一种良性的外部刺激。

「Gemini 3 到目前为止,还没带来我们原本担心的那种毁灭性冲击。虽然它和 DeepSeek 一样,精准地刺痛了我们在产品策略上的软肋,但也倒逼我们做出了极其迅速的调整。」

在奥特曼看来,这种紧急状态通常只会持续六到八周。「我很高兴我们有这种快速反应机制,我们不会在这个状态里待太久。」

OpenAI 显然也明白光喊口号不够,他们今天也正式发布了 GPT-5.2-Codex。

作为专为解决复杂现实软件工程问题而生的智能体编程模型,GPT-5.2-Codex 在通用智能的基础上,融合了 GPT-5.1-Codex-Max 的终端操作能力,更擅长处理代码重构、迁移等长程任务。

而同样是在播客的尾声,当主持人询问「GPT-6 还要等多久?」时,奥特曼敞亮地表示:「我不知道我们什么时候会正式把某个模型命名为 GPT-6,但我预计在明年第一季度,会有比 5.2 有显著提升的新模型发布。」

拉响「红色警报」,到 GPT-5.2 系列的反击,再到 GPT-6 的暧昧预告,OpenAI 试图用新模型与新节奏重建信心,但决定长期胜负的,仍是分发入口、生态协同与算力成本等硬门槛。

Google 的阳谋,与奥特曼的 8300 亿「空城计」

Google 的优势,从来不只在 Gemini 3 Pro 这一个模型上,更在于它几乎无可匹敌的分发渠道。

搜索、Chrome、办公套件。在 AI 赛道,护城河可能是所有科技产品中最浅的。 用户的迁移成本几乎为零,当 Google 的 AI 产品如空气般无处不在,这几乎成了一场无解的阳谋——你不需要「被说服」,你只会「顺手就用」。

更重要的是,在与 Google 的较量中,硬件层面的短板成了 OpenAI 最大的软肋。

相比于 Google 十二年前就开始布局专用 AI 芯片(TPU)所建立的效率优势,OpenAI 每年仍需花费数十亿美元租用算力。即便试图通过自建数据中心和芯片来「补课」,但体验在被追平、成本在被碾压的现状已是不争的事实。

用网友的话来说:

OpenAI 现在并不需要一个更强大的模型,它需要的是 AMD。如果 OpenAI 收购了 AMD,这场 AI 之战就将宣告结束。Google 之所以不怕 OpenAI,是因为它拥有自家的 TPU。但它真正该担心的,是 OpenAI 拥有 AMD。

OpenAI 总裁 Greg Brockman 在最近的视频中也坦言,由于算力捉襟见肘,每当新功能上线(如年初 GPT-4o 吉卜力风格),就必须从研究部门「抽血」,把算力挪给产品部。这是一种饮鸩止渴的循环——为了维持今天的用户体验,被迫推迟了明日的技术研发。

可算力这东西,归根到底就是两个字:烧钱。而且是海量地烧钱。

为此,据 WSJ 报道,OpenAI 已计划发起 1000 亿美元的巨额融资;若一切顺利,这家超级独角兽将在明年 Q1 之前,以 8300 亿美元的估值,再次刷新资本市场的想象力。

而在今年早些时候,软银同意向 OpenAI 投资 300 亿美元,并于上月出售所持的英伟达股份价值 58 亿美元,为这笔投资筹资,并预计尽快完成剩余 225 亿美元的出资。

但钱的问题没那么简单。预计到 2030 年,OpenAI 的现金消耗将超过 2000 亿美元。相比之下,Google 财务稳健,甚至能通过 Oracle 等合作伙伴的股价波动间接挤压 OpenAI 的融资前景。

到处筹钱的 OpenAI,看起来更像是在和时间赛跑。于是便诞生了那个笑话:照奥特曼的融资能力,没准哪天连 Google 和英伟达都能「打包带走」。

但玩笑归玩笑,钱能买来时间,却买不来口碑。

所以在 2025 年这个冬天,狂奔三年的 OpenAI 选择先踩一脚刹车,其实是对的:收拢战线、回撤资源,把方向重新对准 ChatGPT 的日常体验。

这是一次昂贵但必要的纠偏。

技术领先不等于产品好用,基准测试第一不等于用户满意。更重要的是,你不能只在用户怀念旧版本的时候,才想起来问问他们的感受。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌