阅读视图

发现新文章,点击刷新页面。

美国最高法院裁定支持 TikTok 禁令,周受资发视频回应;传网易裁撤战投部;三星与 OpenAI 合作开发 AI 电视

周受资回应,感谢特朗普

北京时间 1 月 18 日,字节跳动集团旗下 TikTok CEO 周受资发布视频,回应美国最高院维持 TikTok「不卖就禁」法案,他称:我们一直在为保护 1.7 亿多美国人的宪法言论自由权利而奋斗,他们每天使用我们的平台连接、创造、发现和实现他们的梦想。
周受资希望代表 TikTok 的每个人和全国各地用户,感谢美国当选总统特朗普致力于与 TikTok 合作,找到一个让 TikTok 在美国可用的解决方案。这是支持第一修正案和反对武断审查制度的坚定立场。(来源:第一财经)
 

亚马逊去年购买的可再生能源比其他任何公司都多

亚马逊去年快速购买可再生能源,新增了约 100 个项目,使其投资组合的发电能力超过 33 千兆瓦。这比与其最接近的竞争对手苹果多出 10 千兆瓦。该公司的总投资组合在公用事业规模的风力和太阳能发电场与现场太阳能发电项目之间大致平分秋色。
亚马逊表示,这些项目总计足以为 830 万户家庭供电。根据 BloombergNEF 的数据,亚马逊成为可再生能源的最大企业买家。(来源:cnbeta)
 

美国最高法院裁定支持 TikTok 禁令

本周日(1 月 19 日)是美国政府强行要求短视频社交平台 TikTok 出售或面临被禁的最后期限。当地时间今天(1 月 17 日)上午 10 点,北京时间深夜 11 点,美国最高法院裁定,支持这一法律。TikTok 在美国有约 1.7 亿用户。
去年 4 月 24 日,美国总统拜登签署一项国会参众两院通过的法案,要求 TikTok 母公司字节跳动在 270 天内将 TikTok 出售给非中国企业,否则这款应用程序将在美国被禁用。(来源:CCTV 国际时讯)
 

消息称网易裁撤战投部:或与海外投资失利有关,超百人受影响

消息人士 1 月 16 日透露,网易在两周前已陆续裁撤整个战略投资部门(以下简称「战投部」),传闻仅留下网易游戏全球投资与合作部总裁朱原(Simon Zhu)坐镇。
报道称,此次裁员规模庞大,或涉及上百人。此次战投部门的大规模裁员,或与网易在近年的海外投资失利有关。知情人士透露,网易战略投资部门的亏损额度很高,这一情况或引起网易最高层的直接不满。
据悉,2024 年 11 月,网易游戏旗下海外工作室 Worlds Untold 宣布暂停运营,该工作室由《质量效应》系列编剧 Mac Walters 于 2023 年 11 月创立。
另外,网易旗下在日本设立的樱花工作室官网已关闭,负责人赤塚哲也似乎已从其领英资料中移除了与樱花工作室相关的所有信息。此外,该工作室唯一作品《圣剑传说:玛娜幻象》的项目总监吉田亮介宣布离职,并确认加入 Square Enix 公司。(来源:雷峰网)
 

消息称地平线组织再调整,苏箐将主导高阶智驾方案落地

1 月 18 日消息,国产智能驾驶解决方案提供商地平线近期发生多项组织调整,主要涉及智能汽车事业部、「土星五号」项目团队等。调整完成后,地平线高阶智驾研发、工程团队的管理权限,将进一步向副总裁兼首席架构师苏箐集中。
地平线智能汽车事业部下属 AE(Application Engineer)应用工程部的大部分人员,将并入智驾算法团队下属的「土星五号」项目。而地平线负责智驾方案测试、交付和功能维护的人员,大部分将继续留在智能汽车事业部。
「土星五号」是地平线高阶智驾研发的项目代号,主要负责基于地平线征程 6P 研发高阶智驾方案 Horizon SuperDrive,团队负责人是苏箐。苏箐此前是华为车 BU 智能驾驶产品部部长,他在 2022 年 10 月加入地平线。
从公开资料获悉,华为于 2021 年 7 月发布的一封人事任免文件显示,免去苏菁智能驾驶产品部部长职务。华为方面当时对此回应称,苏箐在参加外部活动谈及自动驾驶技术与安全时,针对特斯拉,发表了不当言论。
2022 年 1 月,华为方面透露苏箐确已离开华为车 BU,感谢苏箐对车 BU 所做的贡献。(来源:晚点 Auto)
 

极越汽车:启动用户定金退款登记,1 月 22 日起退回

据极越汽车官微,自 2025 年 1 月 17 日起,极越汽车将针对已支付意向金/定金、尚未提车且符合退款条件用户,有序开展全额退款工作。预计 1 月 22 日起,款项会通过银行转账的方式退回至用户的账户。(来源:36 氪)
 

香港破产管理署:香港去年破产呈请增加 17%

据报道,香港破产管理署数据显示,去年破产呈请书数字 9190 宗,是 2015 年后最高,按年升约 17%。单计上月有 781 宗,按月跌逾 6%,按年升近 16%。强制公司清盘呈请方面,去年有 740 宗,按年升逾 30%,是 2009 年后最多。上月呈请有 57 宗,按月跌近 21%,按年升 39%。(来源:界面)
 

拜登要求 AI 基础设施不离岸,巨头海外建设计划或受阻。

近日,拜登签署了一项关于 AI 的行政令,要求美国国防部和能源部租赁联邦场地,然后通过「招标」的方式,让企业在这些联邦场地上建立 AI 智算中心。拜登表示,这项政策旨在确保美国能够快速而大规模地建设 AI 所需的基础设施,包括了大规模 AI 智算中心及 AI 智算中心所需的清洁能源设施。
随着这项行政令出台,云计算厂商的全球 AI 智算中心的建设进程将被减缓。「如果亚马逊、微软和谷歌在海外建设 AI 智算中心计划还处于早期规划阶段的话,那么这些规划可能被搁置或延迟。如果已经投入建设,影响会较小,不过将会改变实际的内部 IT 部署计划。」Omdia 分析师王珅认为。(来源:第一财经)
 

美 FTC 警告:微软与 OpenAI 的合作引发反垄断担忧

美东时间周五(1 月 17 日),美国联邦贸易委员会(FTC)发布报告称,微软与 Open AI 的合作引发了担忧,这家科技巨头可能会将其在云计算领域的主导地位延伸到新兴的人工智能(AI)领域。报告指出,微软与 OpenAI 的合作关系,以及亚马逊和谷歌与 AI 公司 Anthropic 的合作,都增加了 AI 开发公司未来可能被科技巨头「完全收购」的风险。
FTC 主席莉娜·可汗在声明中表示:「FTC 的报告揭示了大型科技公司的合作关系会如何造成锁定、剥夺初创企业的关键 AI 资源,以及泄露可能破坏公平竞争的敏感信息。」(来源:财联社)

三星正着手与 OpenAI 合作开发 AI 电视

据报道,三星电子正在与 OpenAI 协调,在两家公司之间建立「开放式合作伙伴关系」。如果与 OpenAI 的合作关系最终确定,预计将推出各种人工智能驱动的服务,打造新一代人工智能电视。(来源:财联社)
 

苹果首款「负碳」产品,消息称 Apple Watch SE 3 采用海洋回收的塑料材质

1 月 18 日消息,YouTube 频道 Front Page Tech 主播 Jon Prosser 昨日在 X 平台发布推文,曝料称苹果 Apple Watch SE 3 智能手表将采用环保再生塑料材质,并可能推出更多配色以吸引年轻用户群体。
消息称 Apple Watch SE 3 的外壳材质虽然是塑料,但却是从海洋回收的塑料,苹果公司可能会将其宣传为首款「负碳」(Carbon Negative)产品,这与苹果公司一直以来的环保理念相符。

 

负碳(Carbon Negative)指的是一个公司、组织或国家从大气中去除的二氧化碳 (CO2) 比其排放的更多。这意味着他们不仅实现了碳中和(Carbon Neutral 或 Net Zero,排放量等于移除量),而且还产生了净负的碳足迹,有效地帮助减少大气中的 CO2 总量。
彭博社记者 Mark Gurman 在其最新的 Power On 通讯中预测,Apple Watch SE 3 将于 2025 年下半年发布。(来源:IT 之家)

在一家初创公司的帮助下 OpenAI 正在尝试延长人类的寿命

据报道,Open AI 称它与 Retro Biosciences(一家长寿科学初创公司)合作,训练了一种名为 GPT-4b micro 的新人工智能模型,Retro Biosciences 正试图将人类寿命延长 10 年。
报道称,山姆-奥特曼支持的 Retro 公司已经与 OpenAI 就这项研究合作了大约一年时间。GPT-4b 微型模型试图重新设计蛋白质--一组被称为山中因子的特定蛋白质--这些蛋白质可以将人类皮肤细胞转化为看似年轻的干细胞。
Retro 公司认为,这些蛋白质是构建人体器官和提供替代细胞的一个有希望的步骤。
该模型与谷歌获得诺贝尔奖的 AlphaFold 略有不同,后者可以预测蛋白质的形状,但它似乎是 OpenAI 首个为生物研究定制的模型。
OpenAI 和 Retro 表示,他们计划发布有关该模型及其输出结果的研究报告。(来源:麻省理工学院技术评论)

只有模仿没有创新?国产 AI 用行动打破质疑

作者 | Li Yuan 

编辑 | 郑玄

 

大模型时代已经正式迈入第三年。

回首过去的两年,不禁令人感慨。每年都有基座大模型架构已经尘埃落定的声音,然而每年,技术都在飞快地迭代创新,突破人们想象。

2024 年,OpenAI 的推理模型,通过对模型架构的创新,用 RL 的方法延续 Scaling Law,让大模型的智力水平持续进展;而中国公司也并没有落后,价格屠夫 DeepSeek 通过 MLA 的架构创新,让推理成本直接降低了一个数量级。

2025 年开年,令人欣喜的是,我们看到了一向在人们印象中是「低调做产品」的 MiniMax 公司,也加入了开源行列,将最先进的底层技术直接与社区和行业分享。

1 月 15 日,大模型公司 MiniMax 正式发布了 MiniMax-01 系列模型。它包括基础语言大模型 MiniMax-Text-01,和在其上集成了一个轻量级 ViT 模型而开发的视觉多模态大模型 MiniMax-VL-01。

开源界面|图片来源:GitHub

「卷」起来的大模型公司,令人乐见。开源会提升创新效率,越来越好的基座模型之上,才搭建越来越有用的应用,进入千家万户,帮人们解放生产力。

这是 MiniMax 第一次发布开源模型,一出手就是一个炸裂模型架构创新:新模型采用了 MiniMax 独有的 Lightning Attention 机制,借鉴了 Linear Attention(线性注意力)机制,是全球第一次将 Linear Attention 机制引入到商业化规模的模型当中。

效果也是立竿见影,模型上下文长度直接达到了顶尖模型的 20-32 倍水平,推理时的上下文窗口能达到 400 万 token。模型效果立刻在海外上引起了关注。

X 用户感叹 MiniMax-Text-01 可以在 400 万 token 上实现完美的海底捞针 | 图片来源:X

另一个来自中国公司的强大模型,在学术测试集上表现优越|图片来源:X

模型的上下文窗口,指的是模型在生成每个新 token 时,实际参考的前面内容的范围。就像是模型能够一次性从书架上取下的书籍数量。模型的上下文窗口越大,模型生成时可以参考的信息量就越多,表现也就更加智能。

站在 2025 年年初的时间点,长上下文窗口还有一个新的意义:为模型的 Agent 能力,打下坚实基础。

业界公认,2025 年,Agent 能力将是 AI 届「卷生卷死」的重点,连 OpenAI 都在本周内推出了 Tasks,一个 AI Agent 的雏型。在 2025 年,我们很有可能看到越来越多真正「全自动的」AI,在我们的生活中起作用。甚至不同「全自动的」的 AI 共同协作,帮我们处理事务。而这对基座模型的能力,有极大的考验。而长上下文是 Agent 能力实现的必要条件。

看起来,2025 年,基座大模型之战仍未结束;中国公司发力,也才刚刚开始。

 

01

Linear Attention 架构

的第一次大规模使用

 

此次 MiniMax 开源的模型,最大的创新点,在于使用了 MiniMax 独有的 Lightning Attention 机制,这是一种线性注意力。

在传统的 Transformer 架构中,最「烧」算力和显存的部分往往是自注意力(Self-Attention)机制。 原因在于,标准的自注意力需要对所有的词(Token)两两计算注意力分数,计算量随着序列长度 n 的增长是平方级(O(n²))。

如果用通俗的语言来形容,类似于你在举办一场联谊会,人很多。如果每个人都要两两打招呼,沟通成本会随着人数增加而急剧上升,每个人都得重复无数次「握手」。

这带来了一系列的问题——其中一个就是,联谊会的人数,也就是模型的上下文的窗口,很难无限扩展。硬要扩展,对于算力的需求就非常高。

为了应对这一挑战,传统上,研究人员提出了各种方法来降低注意力机制的计算复杂度,包括稀疏注意力、Linear Attention(线性注意力)、长卷积、状态空间模型和线性 RNN 等方式。

此次 MiniMax 开源的模型,就是借用了其中的 Linear Attention(线性注意力)的方式。

Linear Attention 的思路就像给会场安排了几位「速配助理」。每个人先把自己的关键信息交给助理,比如「希望认识什么样的人、擅长什么」。助理整理这些信息后,直接告诉每个人最适合交谈的对象。这样,大家不必一个个自我介绍,整个匹配过程更高效,沟通成本大幅降低。

不过,Linear Attention 之前虽然在理论上有所创新,但在商业规模模型中的采用有限。而 MiniMax 团队则第一次验证了 Linear Attention 机制在商业规模的大模型之上的可行性。

这意味着一项技术从实验室走向真实世界。

MiniMax 团队使用了一个传统的 Linear Attention 的变种,被 MiniMax 团队称为 Lightning Attention。Lightning Attention 解决了现有 Linear Attention 机制计算效率中的主要瓶颈:因果累积求和操作的缓慢,使用新颖的分块技术,有效规避了累加和操作。

在一些特定任务,如检索和长距离依赖建模上,Lightning Attention 的性能表现可能不如 Softmax 注意力强。

MiniMax 团队又引入了混合注意力机制解决这一问题:在最终的模型架构中,在 Transformer 的每 8 层中,有 7 层使用 Lightning Attention,高效处理局部关系;而剩下 1 层保留传统的 Softmax 注意力,确保能够捕捉关键的全局上下文。

这样的架构创新,效果十分惊艳。

MiniMax-01 系列模型参数量高达 4560 亿,其中单次激活 459 亿。在主流模型目前的上下文窗口长度仍然在 128k 左右的时候,MiniMax-01 系列模型能够在 100 万 token 的上下文窗口上进行训练,推理的时候上下文窗口可以外推到 400 万 tokens,是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

在面向现实情景,进行长上下文多任务进行深入的理解和推理的第三方测评 LongBench v2 的最新结果中,MiniMax-Text-01 仅次于 OpenAI 的 o1-preview 和人类,位列第三。

模型在 LongBench v2 上的评测表现 | 图片来源:GitHub LongBench

在模型的基础表现上,MiniMax-01 系列模型也在标准学术基准测试中可与顶级闭源模型相媲美。不仅如此,在模型上下文长度逐渐变长的过程中,模型的表现下降也最平缓——部分模型虽然宣布上下文窗口长度较长,但真正使用起来,在长上下文情况下,效果并不好。

MiniMax-01 系列模型可与顶级闭源模型相媲美 | 图片来源:MiniMax 论文

MiniMax 团队对比了在 CSR(常识推理)、NIAH(大海捞针)和 SCROLLS 等基准测试上,在同样的计算资源下,用采用了 7/8Lightning Attention 和 1/8 的 Softmax 的混合注意力模型可以放更多参数、处理更多数据,并且训练效果还比只用 Softmax 注意力的模型更好,损失更低。

基准测试上混合 Lightning Attention 的架构表现更好 | 图片来源:MiniMax 论文

 

02

为 Agent 时代爆发的前夜做准备

 

自 2024 年开始,长上下文一直是模型迭代的一个重要方向。

在这个领域,国外的 Google、Anthropic,国内的 Kimi,都是坚定的投入者。2024 年年末,DeepMind 的 CEO Demis Hassabis 曾表示,在内部测试中,Google Gemini 正在向无限上下文窗口发起冲击。

或许有人会困惑,此次 MiniMax 发布的 MiniMax-01 系列模型,上下文窗口长度已经达到 400 万 token,如果按照1个 token 约等于1.7个中文汉字的计算方式,已经约等于 700 万字的上下文窗口。人类需要和 AI 聊出这么多的上下文吗?

答案是, 盯住长上下文的各家公司,可能盯住的并不是目前的一问一答的问答 AI 场景,而是背后的 Agent 时代。

无论是单 Agent 所需的持续记忆,还是多 Agent 协作所带来的通信,长链路的任务都需要越来越长的上下文。

长上下文,在多种 Agent 应用场景中,将具有极大的意义。

在搜索场景中,这可能意味着用户可以一次性看到更多答案的综合,直接获得更精准的回答。

未来的效率工具中,这可能意味着用户拥有了无限的工作记忆。在无数版本的修改之后,当甲方让你还是用第 1 版的文章结构和第三版的小标题的时候,你可以无痛回复「好的」,然后让 AI 一键生成两个版本的融合。

未来的学习工具中,这可能意味着用户可以直接具有更大的知识库。直接上传一本教材,就能让 AI 根据其中的内容,进行教学。

而在和 AI 助理的对话中,它将像聪明的人类助理一样,真正记住你之前说过的话,并在你需要的时候「记起来」。MiniMax 团队的论文当中的一个场景就很能说明问题。

模型被要求从最多 1889 条历史交互(英文基准)或 2053 条历史交互(中文基准)中精确检索出用户的一条历史互动——用户重复要求 AI 写关于企鹅的诗歌,同时进行了多轮不相关的对话,而在最后,要求 AI 提供第一次写的关于企鹅的诗。而 MiniMax-01 仍然很好地完成了这一任务。

长上下文的任务表现 | 图片来源:MiniMax 论文

对于 Agent 来说,另一个重要能力,则是视觉理解 ——MiniMax 此次同系列也发布了 MiniMax-VL-01。这是一个同样采用了线性注意力架构、以及拥有 400w token 上下文窗口的视觉多模态大模型。

在 2024 年 Rayban-Meta 眼镜爆火之后,今年的智能硬件的一大看点在于 AI 眼镜能否真正让 AI 成为人们的随身助手。而能成为随身 AI,AI 必须的能力就是长上下文——记住你的所有生活场景,才能在随后为你提供个性化的提醒和建议。

这样的记忆将是「真记忆」,与 ChatGPT 目前的记忆功能所能提供的简易效果完全不同。

要真正实现随身的 AI Agent,跨模态理解、无限上下文窗口都是基础能力。

论文最后, MiniMax 表示未来将在线性注意力这一路径上做到极致,尝试完全取消 Softmax 注意力层,最终实现无限的长上下文窗口。

 

03

基座模型创新未死,

中国公司大有可为

 

值得注意的是,这次是 MiniMax 公司,第一次推出开源模型。

此次的大模型命名的 MiniMax-01 系列,在 MiniMax 的内部序列中,原本是 abab-8 系列模型。

MiniMax 在上一代 abab-7 模型中,已经实现了线性注意力和 MOE 的架构,而在 abab-8 中,取得了更好的效果。

此次,MiniMax 选择在这个时间点,将模型开源出来,并以这个节点为开始,重新命名模型 MiniMax-01。

这似乎代表着 MiniMax 的公司哲学的一种改变。

在过往,MiniMax 公司给外界一向的印象是:业务很稳定,做事很低调。

从星野、Talkie 到海螺 AI,MiniMax 有自己忠实的一波用户群体。在去年的公开发布中,MiniMax 曾经表示每天已经有 3 万亿文本 token 的调用,在国内 AI 公司中名列前茅。

这些应用背后的 AI 技术则一直较为神秘,在此之前主要用于支持公司本身的业务。 这次开源,似乎是一个转折,是 MiniMax 第一次对外高调展示技术实力。

MiniMax 方面表示,模型可以在 8 个 GPU 单卡、640GB 内存上,就能够实现对 100 万 token 进行单节点推理。希望此次开源帮助其他人开发能够突破当前模型的局限。

回顾过往,自 OpenAI 推出 ChatGPT、Meta 发布 Llama 系列开源模型以来,一直有声音表示基座模型的创新已趋于终结,或仅有少数国际科技巨头具备未来模型架构创新的能力。

最近两次中国公司的开源动作,告诉我们并非如此。

2024 年,DeepSeek 凭借其突破性的 MLA 架构,震撼了全球 AI 行业,证明了中国企业的技术创造力。

2025 年年初,MiniMax 再次以其全新的 Lightning Attention 架构刷新了行业认知,验证了一条此前非共识的技术路径。

中国 AI 公司不仅具备工程化和商业化的能力,更有能力推动底层技术创新。

新的一年,不论是 AI 应用的普及,还是技术金字塔尖的攻坚,我们可以对中国 AI 公司有更多的期待。

 

*头图来 源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

Switch2 正式公布;多邻国学中文的美国人数量激增216%;蓝色起源火箭首飞成功|极客早知道

任天堂 Switch 2 游戏机正式公布:屏幕更大、磁吸手柄

1 月 16 日消息,任天堂 Switch 2 游戏掌机今日首发亮相,首个介绍视频展示了其造型设计等细节。据了解,该产品还能向下兼容 Switch 掌机的游戏,官方将在 4 月 2 日的专场直面会上详细介绍这款新机。

细节部分,其外观表面采用了磨砂材质,配备有可调整角度的支架,并在机身上方新增了 USB-C 接口。相比前代机型,Switch 2 拥有更大的屏幕和 Joy-Con 手柄,手柄采用磁吸式设计。

其全新的 Joy-Con 控制器在设计上进行了多项改进。根据官方发布的预告视频,新款 Joy-Con 在连接方式、外观设计以及功能布局上均有显著变化。

值得一提的是,前代 Switch Joy-Con 饱受「摇杆漂移」问题的困扰,即玩家未操作时摇杆仍会检测到移动信号,类似于电脑光标在未移动鼠标时自行移动的现象。然而,任天堂尚未透露新款 Joy-Con 是否解决了这一问题。

在官宣视频中,任天堂确认 Switch 2 支持原版 Switch 的游戏卡带,也就是说可以降低老玩家的游戏成本(可能不支持部分游戏,详情将在任天堂后续官网页面公布)。

宣传片中展示的信息表示,Switch 2 将在今年 4 月 2 日的任天堂直面会上正式发布。(来源:IGN 中国 / IT 之家)

挑战马斯克 SpaceX:贝索斯的蓝色起源「新格伦」火箭首飞成功入轨,助推器回收失败

1 月 16 日消息,北京时间 1 月 16 日 15 时 03 分,蓝色起源「新格伦」重型运载火箭点火升空,开启首飞任务。

经过一个多小时的飞行,蓝色起源官方宣布 GS2 和蓝环探路者(Blue Ring Pathfinder)试验卫星已成功到达目标轨道。

对此,贝索斯的竞争对手——SpaceX 创始人埃隆・马斯克在 X 平台表示祝贺:「恭喜你第一次尝试发射就进入了轨道!」

新格伦是蓝色起源首枚轨道级运载火箭,采用了可重复使用的一级助推器。该助推器计划在发射后返回地球,并在大西洋上以杰夫・贝索斯的母亲命名的回收船「Jacklyn」号上着陆。

不过,直播评论员证实,火箭的第一级在尝试降落在大西洋上的无人船上时损毁,未能完成这次发射任务的次要目标。(来源:CnBeta)

多邻国上学中文的美国人数量激增 216%

全球语言学习平台多邻国(Duolingo)披露,去年 12 月至本周一(1 月 13 日)的数据显示,平台上开始学习中文普通话的美国人,出现同比激增 216% 的惊人变化。根据最近公开的数据,TikTok 在美国已坐拥约 1.7 亿庞大用户群体,营造了一个充满活力的中文社交媒体氛围。面对这股中文热潮,众多美国网友纷纷借助翻译软件应急,同时急不可待地投身于中文学习的浪潮之中。

以多邻国为例,该公司在 TikTok 上发布的一条仅 25 秒的「教美国人学中文」短视频,凭借其独特的魅力和实用性,迅速走红网络,截至目前,已收获超过 83 万次的点赞,彰显了中文学习的巨大吸引力和广泛关注度。

这股中文学习热潮不仅激发了广大美国网友的学习热情,也极大地推动了多邻国软件在美国市场的知名度与影响力。

数据显示,在过去一周内,多邻国在美国苹果应用商店的排名实现了质的飞跃,从原先的 40 名开外一跃进入前 20 强,充分证明了中文学习需求的旺盛以及多邻国平台在其中的重要作用。(来源:快科技)

日本警方逮捕 Switch 游戏机破解人士,任天堂法务部再添「战绩」

1 月 16 日消息,游戏盗版监管进入了一个新时代,日本警方首次逮捕了被指控破解 Switch 游戏机硬件的人。

据 NTV News 报道,1 月 15 日,一名 58 岁的日本男子因涉嫌违反《商标法》被捕。他涉嫌在出售 Switch 游戏机之前修改 Switch 硬件从而运行盗版游戏。

这名男子被指控在硬件上加载了 27 款非法访问的游戏,并以每台 28000 日元(IT 之家备注:当前约 1312 元人民币)的价格出售这些游戏机。

据警方说,该男子已经承认了这些指控,目前正在调查其他可能的违法行为。

任天堂此前一直在和盗版游戏行为作斗争,已经成功「消灭」了热门 Switch 游戏模拟器 Yuzu,还阻止了 GameCube 和 Wii 模拟器 Dolphin(海豚)在 PC 游戏平台 Steam 上发布,并且起诉了游戏文件共享网站 RomUniverse 等。(来源:CnBeta)

支付宝被曝出严重事故 Bug 5 分钟内所有订单减免 20%

根据 V 快科技报道,今天支付宝发生了堪称为 P000 级的事故。爆料称,从目前的情况来看,在购物、还信用卡、缴纳签证等场景下,在今天下午 14:40-14:45 期间,所有订单都被「政府补贴」减免 20%。

有可能是支付宝在测试国补时出现线上 Bug,从而导致所有人线上支付时可以直接使用国补减免。

爆料者还称这是其见过最严重的支付宝 Bug,「不知道后面支付宝会怎么处理这个事情,反正程序员春节是过不好了」。

也有不少网友晒出了减免的相关截图,包括游戏充值、转账等场景在付款时都显示有政府补贴。(来源:快科技)

黄仁勋在英伟达年会向中国员工发最高 4 万元红包,「下次来 10 万」

1 月 16 日消息,据界面新闻报道,英伟达 CEO 黄仁勋昨晚出席了在深圳公司的年会,并对员工的努力工作致谢,发放了数额 1 万元、2.5 万元的红包各十余个,还发放了 5 个 4 万元的红包,「下次来是 10 万块!」

在稍早之前谈到此行的目的时,黄仁勋表示是与员工一同庆祝春节。根据此前的爆料,黄仁勋本周赴中国计划访问多个主要城市,深圳之后还计划访问上海和北京,晚些时候飞往台北。而在今日下午,黄仁勋则来到了台中并造访硅品精密台中潭子新厂。另据台媒「中央社」报道,黄仁勋在台中表示,英伟达 Blackwell 平台 CoWoS-L 产能增加,所以 CoWoS 产能没有减少的问题,预期今年 CoWoS 整体产能可继续大幅增加。

据此前报道,黄仁勋去年的中国之行中,为北京、上海、深圳三地的年会准备了不同的活动。其在年会上身着「大花背心」与员工们一起扭秧歌,以庆祝龙年春节。(来源:IT 之家)

为扭转销售颓势,特斯拉 Cybertruck 电动皮卡打折促销

1 月 16 日消息,据 Business Insider 报道,特斯拉开始对其 Cybertruck 电动皮卡进行打折促销,以应对该车型近期销售下滑的局面。根据特斯拉美国官网信息,购买全新 Cybertruck 的消费者可享受高达 1600 美元(备注:当前约 11743 元人民币)的折扣。此外,特斯拉还提供少量行驶里程仅为数百英里的 Cybertruck 展车,折扣幅度达到 2600 美元(当前约 19082 元人民币)。

特斯拉此前已将其位于奥斯汀工厂的部分 Cybertruck 生产线员工调至 Model Y 的生产线,这一调动并不常见。Model Y 是特斯拉目前最畅销的车型,而 Cybertruck 则是特斯拉自 2020 年推出 Model Y 以来的首款全新乘用车,自 2023 年上市以来,其销售表现一直备受关注。

尽管特斯拉并未单独公布 Cybertruck 的销售数据,但该公司表示,2024 年共售出 8.5 万辆「其他车型」,包括 Cybertruck、Model X 和 Model S。根据 Electrek 发布的在线追踪数据,Cybertruck 在发售前已积累了 200 万份预订。特斯拉声称,这款非传统的越野车目前已实现盈利,并且行业数据显示,其销量仍超过福特 F-150 Lightning 等竞争对手。

尽管特斯拉在 2024 年底推出了大量激励措施,但这并未能阻止其在 2024 年首次出现年度销量下滑。目前,特斯拉正致力于实现埃隆・马斯克提出的 2025 年销售增长 20%-30% 的目标,并于上周在亚洲推出了改款 Model Y。

此外,Cybertruck 在 2024 年还面临多次召回,问题包括巨大的雨刷器故障以及加速踏板可能卡在全油门位置的风险。这些质量问题无疑对消费者的购买信心造成了一定影响。(来源:IT 之家)

特斯拉的自动驾驶出租车业务将于下半年开始商业运营

由于特斯拉庞大的市值现在几乎全部取决于其在 FSD/自动驾驶出租车和 Optimus 人形机器人方面所宣称的雄心壮志能否获得有利的结果,华尔街的反应可想而知,在过去的几周里,华尔街推出了大量的研究报告来描述特斯拉的技术进步。今天,轮到高盛分析师马克-德莱尼(Mark Delaney)阐述他对特斯拉的看法。

德莱尼首先指出,"根据我们自己最近的试乘、众包数据和第三方评论",刚刚发布的特斯拉 FSD 第 13 版的性能有了"有意义的改进"。

这与目前市场上的普遍评论不谋而合,comma.ai 总裁乔治-霍兹(George Hotz)最近称赞特斯拉 FSD 第 13 版"非常出色"。

因此,这位高盛分析师现在预计,特斯拉的自动驾驶出租车业务将"在下半年开始商业运营",使用"远程协助和地理围栏",这"在方向上类似于竞争对手目前在道路上使用的自动驾驶出租车的方法"。(来源:CnBeta)

三星将与 OpenAI 合作开发"AI 电视"

据报道,三星电子正在与 ChatGPT 的创建者 OpenAI 合作开发人工智能电视。这标志着三星的战略,即在竞争日益激烈的电视市场中保持领先地位。三星希望将 OpenAI 的力量融入电视,进一步巩固其作为世界顶级电视品牌的主导地位--这一头衔它已连续保持了 19 年。

值得注意的是,三星和 OpenAI 已经在一项"开放合作"中进行了合作,为产品和服务(尤其是电视)中集成了先进的人工智能功能,例如点击搜索(类似于 Circle to Search)、实时翻译、生成壁纸等。

通过与 OpenAI 合作,三星旨在推出创新功能,如文本生成功能"ChatGPT"、图像创建功能"DALL-E"、语音识别功能"Whisper"以及其他 OpenAI AI 模型。人工智能电视的一些潜在功能可能包括:

个性化内容推荐

对话助理

支持多任务处理

实时翻译

定制医疗保健建议

定制娱乐

例如,用户可以就正在观看的演员或电影向电视提问,并获得类似节目的推荐。根据市场研究公司 Omdia 的数据,三星希望通过与科技巨头合作并为其电视推出新功能来提高其电视市场份额,该市场份额在 2024 年上半年达到 28.8%。最近,该公司与 Google 合作推出了"Eclipsa 音频",这是一种 3D 音效技术,其目的是对抗杜比全景声(Dolby Atmos)。

OpenAI 尚未就其与三星的合作发表评论。与此同时,苹果也被认为正在评估再次制造电视产品的想法,但这可能需要一段时间才能实现。(来源:CnBeta)

「超薄款」iPhone 17 Air 电池容量将低于 4000mAh

据知名数码博主 @ 数码闲聊站爆料,苹果即将推出的 iPhone 17 Air,为了轻薄设计,可能配备容量在 3000 至 4000mAh 之间的电池。这一数据,相比此前的 iPhone 16,其电池容量可能有所减少,这与其主打的极致轻薄设计密切相关。

目前,苹果尚未正式透露 iPhone 16 的具体电池容量,但拆解数据显示,iPhone 16 的电池容量为 3561mAh。

如果 iPhone 17 Air 能保持这一水平,或许能解决续航问题。

不过,泄漏信息显示,iPhone 17 Air 的机身最薄处仅为 5.5mm,接近 13 英寸 iPad Pro 的 5.1mm 厚度,这将使大容量电池的设计面临更大挑战。

除了电池容量引发关注外,iPhone 17 Air 还可能取消物理 SIM 卡槽,仅支持 e-SIM,并配备一颗 4800 万像素的后置摄像头以及苹果自研的 5G 调制解调器。

iPhone 17 Air 预计售价在 900 美元左右,定位于替代现有的 iPhone Plus 系列,预计将在 2025 年 9 月与 iPhone 17 系列一同发布。(来源:CnBeta)

地球当背景,谷歌 Pixel 联手 NASA 前工程师推出太空自拍项目

1 月 16 日消息,谷歌 Pixel 与 NASA 前工程师、YouTube 网红马克・罗伯特(Mark Rober)合作,推出了一项极具创意的太空自拍项目。通过这一合作,用户的自拍照将有机会被一颗名为 SAT GUS 的卫星拍摄,并以地球为背景在太空中定格。这一项目不仅充满趣味,还旨在激发年轻一代对科学、技术、工程和数学(STEM)领域的兴趣。

据了解,这一项目的核心设备是 SAT GUS 卫星,它将在太空中拍摄用户通过 Pixel 手机提交的自拍照,并以地球作为背景。参与者只需通过谷歌商店的专属链接注册并提交自拍照,即可实时追踪 SAT GUS 的运行轨迹。当卫星处于最佳位置时,它将拍摄用户的自拍照,并将这张独特的太空自拍照发送给用户,供其与亲友分享。

马克・罗伯特以其在 YouTube 上发布的寓教于乐的科普视频而闻名。他希望通过这一项目,让更多人尤其是年轻人感受到科学与工程的魅力,并鼓励他们探索 STEM 领域的职业发展机会。他表示:「这个项目将尖端技术与趣味性相结合,是激发人们对 STEM 好奇心的绝佳方式。」

值得一提的是,这一项目此前曾通过 T-Mobile 的「T-Mobile Tuesdays」计划向 T-Mobile 用户开放。如今,该项目已向所有感兴趣的用户开放,任何人都可以参与这一太空自拍活动。(来源:CnBeta)

 

TikTok「硬刚」之下,转机来了

 

这可能是人类商业历史上第一次,高达1.7亿用户量和千亿美金价值的公司,选择不自由,毋宁死。

1月15日,据报道,TikTok 准备周日在美国立即关闭服务,除非最高法院介入阻止「不卖就禁」禁令。

报道称按照这一计划,用户在尝试打开TikTok时,将看到一条弹窗消息提示他们访问一个网站以了解禁令的详细信息。与此同时,TikTok还会提供数据下载选项,允许用户将个人信息保存下来。

若此举落地,这一决定将标志着,TikTok从不断的抗争到无路可退的关键,最终坚持不退,「生是人杰,死亦鬼雄」。

但看起来也并非没有转机。最新消息是,据央视新闻报道称,有知情人士透露,拜登政府正在考虑如何让TikTok在美国继续运营,「官员们正在『探索选择』如何实施该法律,让 TikTok 不会在本周日被禁。」

图片来源:央视新闻

 

自2019年美国政府提出国家安全审查以来,TikTok面临的压力几乎从未停歇。

随着「不卖就禁」最后期限的逼近,TikTok宁愿采取果断措施,直接关闭应用,让所有用户都直面禁令的冲击。这一选择无疑将让全球最大的短视频平台面对前所未有的挑战。

倒计时只剩3天,无论转机是否能在最后时刻之前出现,TikTok的坚持已展现出强大的抗压能力和对自身价值的坚定捍卫。

TikTok的故事,已不再只是一个科技企业如何应对政治与商业压力的简单叙事,它早已变成了一个关于全球化背景下,国家、企业与用户之间复杂博弈的缩影。

正如几年前其初出茅庐时一样,TikTok已超越了短视频平台的定位,成为全球化竞争中的重要棋子。

如今,站在生死抉择的关头,TikTok显然不是单纯以商业利益为导向,而是选择了更具历史意义的「刚」——不畏强权、不轻易妥协的姿态,这种态度或许将影响未来科技行业与海外互动的深远格局。

 

TikTok 已退无可退

 

过去两天,小红书正在被外国人疯狂涌入,中外网友在这个App上嬉笑怒骂,打成一片,但在这副表面繁荣的互联网「胜景」背后,其实是商业史上少见的一个关键的时刻逐步逼近。

 

一家在美国拥有高达1.7亿用户量和千亿美金市值的公司,正处于前所未有的生死存亡的关键节点,这种局面,恐怕在商业史上也难以找到先例。

 

去年4月,美国国会通过了一项立法:禁止或强制母公司字节跳动出售 TikTok。该法案后经总统拜登签署成为法律,标志着TikTok将遭遇最严峻的命运——TikTok 将于今年 1 月 19 日在美国被禁用,除非它与中国母公司字节跳动断绝关系。

 

但我们知道,这场刁难从2019 年 11 月就开始了,当时,美国政府对 TikTok 母公司字节跳动收购 Musical.ly 进行了国家安全审查,关注点在于用户数据的处理和存储。

 

此后的几个月里,美国参议院多次举行听证会,推动立法禁止TikTok。到了2020年8月,时任总统特朗普签署了行政命令,要求TikTok在90天内剥离美国业务,并采取一系列限制措施。尽管这些禁令并未立刻生效,但美国外国投资委员会(CFIUS)紧接着对TikTok展开了更为严格的审查。

 

2021 年 6 月,拜登政府虽然撤销了特朗普时期的禁令,但实际上相关的施压和限制力度更为加强。

 

TikTok 过往尝试了多种努力试图解决问题。包括建立「透明度和问责中心」;成立内容顾问委员会;成立专门的美国数据安全公司(USDS),负责管理美国用户的数据; 实施名为「Clover」的数据隔离工程和「Texas」的数据安全工程,这两项计划的年度运营成本均达到了大约 10 亿美元;聘请具有美国背景的高管;与甲骨文(Oracle)达成协议,甲骨文将成为 TikTok 在美国的「可信技术提供商」,根据协议,甲骨文有权对 TikTok 美国的源代码进行安全检查。

 

过往的努力以及后来TikTok 为阻止提案所做的一系列努力——包括劝说用户向国会代表投诉,以及在距离最终投票仅剩几天的时候投放广告,宣传 TikTok 在数据安全方面所做的努力,随着美国国会通过这项法案,均以失败告终。

 

但 TikTok 并没有停止抗争的步伐。去年5月,TikTok及其母公司字节跳动向美国联邦法院提起诉讼,要求法院裁定旨在封禁TikTok的《保护美国人免受外国对手控制应用程序法》违宪,并要求推翻。

 

图片来源:视觉中国

 

9月,TikTok及其创作者诉美国政府的诉讼在美国哥伦比亚特区联邦巡回上诉法院正式审理。TikTok及字节跳动主张,该法案要求的「合格的资产剥离」在商业、技术及法律上均不可能实现,且无法在规定的270天内完成;即便法案要求的「有条件的剥离 」在操作上可行,也从根本上违背了美国宪法对言论自由和个人自由的承诺。

 

12月,美国联邦上诉法院驳回TikTok的上诉,维持了要求字节跳动剥离TikTok美国业务的禁令。

 

一路以来,TikTok尽力抗争,如今已退无可退,或许只有「刚」到底,未来才可能有一线转机。

 

与此同时,据报道,当选总统唐纳德·特朗普正在考虑发布一项行政命令,暂缓执行禁令60至90天。特朗普的任期将从禁令生效的第二天开始,但报道上并没有说明特朗普将打算如何合法地实施这一措施。

 

此外,上周,美国马萨诸塞州参议员爱德华·马基在参议院发表讲话并在TikTok上直播。他在讲话中提到计划提出立法,要求将TikTok「不卖就禁」禁的最后期限再延长270天,称禁令生效将重创美国社会和文化生态,数百万美国人将失去表达渠道,并对那些依赖该应用建立社会联系和维持生计的美国人造成严重影响。

 

但最后期限已迫在眉睫,倒计时只剩3天,变数会发生吗?

 

中美互联网世界,打开一扇窗?

 

是直接关停,还是继续运营,抑或是缓刑等待川普上台后再作审判,TikTok 在美的结局将在 3 天后得到答案。

 

但站在今天的时间点上,尤其是看到发生在小红书上的「drama」一幕,我们已经可以开始思考:TikTok 存亡尘埃落定之后,中美互联网世界会何去何从。

 

首先可以肯定的是:TikTok 封禁以后,抖音开放国际注册,然后美国TT用户涌入国内避难大概率是无稽之谈。

 

图片来源:视觉中国

 

1月15日起,抖音上出现大量IP属地显示为美国、英国、俄罗斯、泰国等地的用户视频,手机号注册页面也显示全球多国国际电话区号可选。

 

不过这并不代表抖音开放了海外IP注册,字节方面并未直接回应抖音是否开放海外用户注册,而抖音集团李亮则在微博回应称,「有海外IP不代表是海外注册用户。另外我们发现,这一波也有很多人浑水摸鱼,搬运视频仿冒外国用户,尤其是一些黑产团伙想借机涨粉养号。这些账号鉴别起来有一些难度,这几天我们在积极治理,目前已经处置了1万多个仿冒外国用户的账号。」

 

换句话说,目前出现在抖音的大量外国人录制视频,有部分可能是海外搬运或者国内黑产团队利用「假老外」引流。

 

即使不谈外国用户注册国内APP可能涉及的国内外监管问题,外国创作者和用户进入抖音和小红书等平台后,能否融入这些中国互联网社区也是一个巨大的挑战。

 

显然小红书并没有做好国际化的准备。一个例证是,今天小红书APP并没有X、ins、TikTok等国际化APP必备的翻译功能,大量海外用户涌入后,评论区的跨国交流还是靠中国用户说英文或者翻译器。当然,这并不是复杂的技术问题,以今天的AI基础设施发展水平,高质量多语种翻译很容易实现,如果有需要的话小红书的产品团队不难短时间内作出功能更新。

 

更深层次的挑战,在于如何在这些以国内社区为主的平台上做好国际化的用户运营。

 

今天来小红书「避难」的海外用户,最初的动机大多是出于对封禁TikTok的反感,而与国内用户交流甚欢,则大多出于初次接触真实中国用户的「新鲜感」。小红书社区的特点是「分享真实生活」,当然可能比现实世界有的时候更精致了一点,但对于95%以上都没有去过对方国家的中美用户而言,这种交流充满了新鲜感。

 

不论是分享对方的美食美景宠物,还是帮忙做英语作业,抑或是玩一些「你给我发F22舱内图,我找你要六代机设计图」的国际梗,这种真实交流无疑对中美用户而言都是新鲜的。

 

但对于一个社区的长期用户运营,新鲜并不足以「保鲜」,就像是中国给部分国家民众开放免签停留后,不少外国人来中国旅游一样,小红书现在也成了一部分美国人的赛博打卡地。

 

而在新鲜劲过去以后,重要的是要让海外用户在这里「生活」,每天使用消费内容;让海外创作者持续投稿,并获取商业收益。小红书依然要像所有海外产品做过的那样分IP区域运营用户,并进一步构建海外的运营、商业化体系,这与字节当年做过的事情并无区别,并且还要与字节的lemon8和ins等同类产品展开竞争。

 

不过即使做不成海外同类产品的替代品,在一些特定场景下发挥价值,为海外民众了解真实的中国打开一扇窗户,小红书依然有可能借着这次机会挖掘出新的可能性。

 

事实上,就像过去留学生群体使用小红书作为留学生活攻略指南一样,在小红书的海内外用户交流中,依然可以看到热闹和新鲜之外给双方带来了不少实用性的交流。比如中国用户为希望前来中国旅游的外国人提供当地的景点、美食攻略,地道的欧美人来为中国学生讲解英文语法,这种对用户的「真实有用」一直是小红书的社区基石,加上这次契机,也可能成为小红书国际化破局的开始。

 

无论如何,这次 TikTok 的深远影响,早已超越了单纯的产品范畴。1月19日后,一切答案将逐渐揭晓,而由此引发的诸多挑战与机遇,必将成为我们未来长期思考的重要课题。

头图来源:视觉中国

AI 公司是真「饿了」,开始砸钱买你拍的「废片」

做过 Up 主、YouTuber 或是视频自媒体从业者都知道,一部传到平台上 10 分钟的成片,背后可能是几个小时的素材。如同快充般的「拍摄 1 小时,剪出 1 分钟」。而在电影行业,常见素材比也在 10:1 到 20:1 甚至更高。

那些被弃用的素材叫做「废片」,在成片输出后,这些素材就如同废品一样,留着只会占据硬盘空间。

但就像现实生活有愿意花钱收废品,现在大 AI 公司想开始花钱「收废片」了。

1 月 11 日,据外媒报道,Open AI、Google、Moonvalley 等公司正在购买视频创作者们拍摄但未使用的「废片」。 高质量 4K、无人机、3D 动画素材,1 - 4 美元(约合 7.3 - 30 元)一分钟 ,为了 YouTube、TikTok、Instagram 等网络视频制作的素材 1 - 2 美元(约 7.3 - 15 元)一分钟。

这么看,只要废片质量足够好,一个小时的废片最高能卖 1800 元,可能比平台给 Up 主的分成还高。

 

01

AI 巨头,是真的「饿了」

 

为什么这些科技公司,要花钱买用户拍了不用的废片?

原因很简单: 视频数据不够用了

生成式视频模型、自动驾驶系统甚至机器人训练,都需要大量的视频作为训练数据。而优质视频不仅创作门槛高,在 AI 时代的版权划分也很模糊。

广告、电影公司的版权价格昂贵,网络平台通常也只有发行权而非使用权,和导演及制作团队签署的版权合同里,也鲜少涉及到 AI 使用权的条款。

视频网站同理,如果视频模型想合法抓取 YouTube 的视频,那应该联系 YouTube 还是 YouTuber?这同样是 AI 时代还没解决的版权灰色问题。

YouTube 也没有第三方内容的使用许可权|图源:YouTube

2024 年 4 月美国众议员提出的《生成式 AI 版权披露法案》,要求数据集制作者向注册员提交「任何受版权保护的作品的充分详细摘要」,否则将面临罚款。

在此背景下,Open AI、Google 还有其他 AI 公司就想到了「不买成片买废片」的方式。

不过 AI 大公司并不直接和创作者对接,而是通过第三方专业公司去联系平台和创作者 ,他们只付钱。怎么谈、找谁买、买回来怎么用,这些都由中介公司和平台协商。

几家中介公司表示,目前已经买了 500 多万美元的素材,对接的 AI 公司多达 17 家,包括 OpenAI、Meta、微软等。

AI 公司买回来后也不能乱用,由第三方专业公司做「中介担保」限制了废片的使用范围:AI 公司不能创建创作者的数字分身;不能在 AI 模型里重现专属创作者的 AI 场景,比如直接生成某个 Up 主固定的背景或是用 ta 的经典梗、口头禅等;不能用有损创作者声誉的方式使用素材。

对网红 YouTuber 而言,脸是「身份标识」|图源:PewDiePie

YouTube 在上个月也加入了类似的新功能:YouTuber 自行决定 AI 是否能抓取自己的视频内容,甚至可以选择授权的 AI 公司(当然也可以全选)。不过目前 YouTube 还没有给出授权费用的政策。

授权名单中有十八家主流 AI 公司|图源:YouTube

 

02

视频模型的军备竞赛

 

互联网内容的发展,随着带宽和信息量的增长,轨迹从文字逐渐转向视频,大模型也是如此。

视频模型成为过去一年大模型最卷的赛道,很多 AI 公司更进一步,直接开始卷可以生成动态场景的「世界模型」,但无论哪种模型,数据养料都离不开视频。于是各大 AI 公司纷纷开始了军备竞赛,谁能拿到更多的视频数据,谁的视频模型可能就会更好。

在前不久的 CES 2025 上,英伟达发布了世界基础模型平台 Cosmos。据介绍,Cosmos 经过了 2000 万小时的视频训练量。然而英伟达在去年就曾被 404 Media 爆出,在未经授权的前提下,违规抓取了大量 YouTube 和 Netflix 的视频以训练「内部名称为 Cosmos 的产品」。

英伟达内部在 Slack 的聊天记录|图源:404 Media

据爆出的英伟达内部聊天记录,英伟达的 AI 科学家和高管汇总了大量 YouTube 精选视频数据集用于模型训练,包括一个名为 HD- VG-130M 的数据集,该数据集由北大的研究人员构建,包含 1.3 亿个 YouTube 数据,使用权限仅限于学术研究。

在被质疑「YouTube 服务条款禁止下载,数据也只能用于研究目的」后,英伟达高管表示「受版权保护的数据能否用于训练,目前是一个悬而未决的法律问题……在大语言模型上,我相信我们的法律团队已经批准了这种做法,因此也可能会批准视频训练。」

在英伟达之前,OpenAI 的视频大模型 Sora 已经被 YouTube 点名批评了。正在和 OpenAI 打官司的《纽约时报》率先报道称,OpenAI 采集了超一百万小时的 YouTube 视频用来训练 GPT-4。

而对 Sora 训练数据来源,当时的 OpenAI 首席技术官(已离职)Mira Murati 直言「实际上,我也不确定」YouTube CEO Neal Mohan 回应称「如果 OpenAI 使用 YouTube 视频来训练 Sora,就明确违反了 YouTube 的使用条款。」

同样的态度,YouTube 又把这段采访发给了 404 Media,回应了一次英伟达。

也有视频模型另辟蹊径,将在未来两个月内公布的新视频模型「Marey」要做行业里「最干净」的,他们号称全部训练数据都拿到了授权,而且 Marey 的目标用户就是好莱坞和整个电影行业的大型工作室。

图源:Moonvalley

这是因为电影不仅是视频质量素材的巅峰,也是对版权规范最严格的视频领域。

对网络视频创作者而言,废片本身的归宿就是备份硬盘甚至回收站,如今有大公司愿意出钱让「废片再利用」,如果这种模式能持续运转,也不失为对小创作者的一种营收手段。

对更大牌的「创作者」,比如电影公司、制片厂而言,技术早已渗透甚至改造了电影行业,从 CGI 生成、虚拟制作到 AI 合成语音、面部去老化等等,AI 无非是一种提高影视制作效率的新技术手段。

但无论大小创作者,或许对 AI 视频生成都有着「杀鸡取卵」的警惕感。试想,当一个创作者源源不断地把自己的废片卖给 AI 模型,当 AI 模型已经足够以假乱真的时候,我们是否还真的需要一个具体的创作者出镜?当 AI 可以生成电影级空镜头,极具视觉冲击的特效后,电影行业还是否需要技术高超的摄影师、数字特效制作者……

「学习你,追赶你,替代你」这是每一个创作者面对生成式 AI 的进化时,都难以避免的恐惧。只能自我安慰道:在挡不住的 AI 浪潮下,废片还能卖钱,这总比免费当个「数据提款机」要强吧。

*头图来 源:www.zoetispetcare.com

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

传 TikTok 计划周日完全关停美业务;OpenAI 推出新功能「Tasks」;《王者荣耀》纯血鸿蒙版上线

TikTok 硬刚美国禁令:消息称计划周日完全关停在美业务,用户可下载保存个人数据

1 月 15 日消息,据外媒 The Information 今日报道,除非美国最高法院介入阻止禁令,TikTok 计划于当地时间本周日(1 月 19 日)全面关闭其在美国的应用。与其让已经下载的用户继续使用,TikTok 选择直接关闭应用,届时所有用户切身感受到禁令的影响。

报道称根据计划,尝试打开 TikTok 应用的用户将会看到一个弹出消息,指引他们前往一个介绍禁令信息的网站。其中一位知情人士表示,TikTok 还计划为用户提供下载个人数据的选项,以便他们保留自己的信息记录。

这项法律要求 TikTok 于 2025 年 1 月 19 日前,从母公司字节跳动拆分出来,否则将在美国被禁用,这一裁决让 TikTok 在美国这一关键市场的前景更加不明朗。

TikTok 已经以第一修正案为依据向最高法院提起上诉,并等待裁决。然而,上周五最高法院就此案的口头辩论中,法官们的提问表明,法院很可能维持该禁令。(来源:IT 之家)

消息称小红书团队在加班了:针对 TikTok 难民做优化

1 月 15 日消息,据媒体报道,从本月 1 月 13 日起,因为大量发帖自称「TikTok 难民」的美国用户涌入小红书平台,这一行为推动小红书在 1 月 14 日登上了 App Store 美区免费排行榜第一。

据一位接近小红书内部人士透露,小红书团队从 1 月 13 日当天就开始加班了,目前正在针对外国用户做功能优化,他们希望努力承接住这波泼天流量。

同时,小红书内部合规、安全相关的团队也同步开展工作了。此外,他还表示,这波「TikTok 难民」用户,或许很快就能体验到小红书开发的新功能。。

相比其他社交类软件,目前小红书没有自带翻译功能,国外使用者只能使用英文和第三方翻译软件交流。

此外,因为抖音与 TikTok 对内容进行了划分,并且能限制注册手机号的所在地。但紧随其后的小红书,目前还暂未对内容进行模块区分,海外用户注册来源相对简单。(来源: 快科技)

 

美团推出「浣熊食堂」外卖集合店,可一次性下单不同商家餐品

1 月 16 日消息,据 Tech 星球报道,美团正在北京试水名为「浣熊食堂」的业务,这是一家外卖集合店,店内商家几乎都是连锁餐饮品牌,比如老乡鸡、全聚德、云海肴等。

用户可以在「浣熊食堂」一次性下单不同商家的餐品,骑手一次性就可以配送到位。取餐方式上,浣熊食堂目前不支持堂食,用户可以选择到店自取或者骑手配送。

报道称,浣熊食堂的商家都要通过培训上岗,菜品现炒先做,每天会有安全卫生检查,包括商家的食材进货清单、打烊后的厨具、储存空间是否保持整洁等方面。

美团相关负责人透露,推出浣熊食堂,是希望提升纯外卖店的食品安全标准,由平台统一监督食品安全问题,保障消费者点到放心外卖。

浣熊食堂计划在北京望京、东直门、大郊亭桥等地区开设外卖服务,目前望京地区已可以使用浣熊食堂线上店进行外卖点单。

浣熊食堂在线上有两个入口,一个位于美团外卖 App 的功能频道内,与拼好饭等热门业务并列;另一个则是通过微信搜索浣熊食堂小程序。(来源:IT 之家)

 

OpenAI 推出新功能「Tasks」ChatGPT 可变身成 AI 私人助理

1 月 15 日消息,据外媒报道,OpenAI 今日在社交网络上宣布,为 ChatGPT 引入「Tasks」(任务)功能,支持用户安排提醒、更新和警报,来增强用户体验。目的是将 ChatGPT 转变为一个主动的助手。

新功能「Tasks」目前还处于测试阶段,仅向付费订阅用户开放。

凭借这一新增功能,用户可以使用简单、自然的语言提示轻松安排各种活动。ChatGPT 现在可以提供每日天气更新,提醒用户诸如护照续签或门票销售等重要日期,甚至还可以每天晚上给孩子们发送有趣的笑话。

一旦安排好,ChatGPT 将在指定时间自动执行这些任务,使其成为管理日常活动的高效工具。

要使用此功能,符合条件的用户必须从模型选择器中选择「带计划任务的 GPT - 4o」,并描述所需任务及其时间。虽然可以在任何平台上设置任务,但目前只能通过网页版的「任务」部分在个人资料菜单中管理和修改任务。

该功能还提供一定程度的自动化,ChatGPT 会根据用户互动建议任务。用户可以选择接受或拒绝这些建议,让助手更好地满足个人需求。(来源:来源: TechWeb)

 

微软悄然撤下仿冒谷歌搜索的界面,曾被指试图误导必应用户

1 月 15 日消息,TheVerge 今日报道,微软悄然撤下了其仿冒谷歌搜索的界面,该界面此前被用于让必应用户误以为自己在使用谷歌搜索。本月初,用户在必应上搜索「Google」时,会出现一个与谷歌极为相似的页面,包括一个特殊的搜索栏、类似谷歌涂鸦的图片,甚至搜索栏下方还有与谷歌搜索相似的小字提示。

然而,本周这一误导性界面已从必应的「Google」搜索结果页面中消失。此前,Reddit 论坛上的用户称,微软仿造的界面甚至会自动将页面略微向下滚动,以掩盖必应搜索栏出现在页面顶部的真实情况,这一做法显然是为了让必应用户误以为自己正在使用谷歌。

对于这一做法,微软拒绝置评,但谷歌方面则毫不掩饰地表达了不满。谷歌 Chrome 负责人帕里萨・塔布里兹(Parisa Tabriz)上周在 X 平台上发文称:「模仿是最真诚的奉承,但微软仿冒谷歌主页是其长期混淆用户、限制选择的又一伎俩。新年新低,微软。」(来源:IT 之家)

苹果 AI 功能冷遇:超过 60% 用户对 Apple Intelligence 不感兴趣

海外的报告指出,苹果用户对 Apple Intelligence 的使用反应显得有些冷淡,有超过 60% 的用户表示,对 Apple Intelligence 的兴趣不高,认为手机的其他功能对日常的使用体验更重要。

另外,报告也给出了 iPhone 用户为何对 Apple Intelligence 无感的原因:

数据显示,未升级到最新 iOS 系统版本是主要原因,占比超过 5 成,这意味用户不会因为 Apple Intelligence 而积极升级系统;此外,部分用户认为实用性不足,或对 AI 的准确性抱持怀疑态度。

知名分析师郭明錤也泼了 Apple Intelligence 冷水。他指出,至今尚无证据显示 Apple Intelligence 能贡献苹果的硬件换机潮与服务营收,推测苹果在 2025 年可能会面临更大的挑战。(来源:快科技)

 

阿里巴巴等公司入股人形机器人研发商星动纪元

1 月 15 日消息,北京星动纪元科技有限公司发生工商变更,新增阿里巴巴旗下杭州灏月企业管理有限公司、成都高新策源优产股权投资基金合伙企业(有限合伙)等为股东,注册资本由约 874.8 万人民币增至约 1095.9 万人民币。

IT 之家从星动纪元官网获悉,该公司由清华大学交叉信息研究院孵化,也是唯一一家清华大学占股的人形机器人企业。创始人陈建宇是清华大学博士生导师、助理教授。

北京星动纪元科技有限公司成立于 2023 年 8 月,法定代表人为张志,经营范围含智能机器人的研发、服务消费机器人销售、智能机器人销售、人工智能基础软件开发、人工智能应用软件开发、人工智能公共数据平台等。(来源:IT 之家)

 

MiniMax-01 开源:新架构开启 Agent 时代

1 月 15 日消息,MiniMax 发布并开源了 MiniMax-01 全新系列模型,其中包含两个模型,基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。

在 MiniMax-01 系列模型中:首次大规模实现线性注意力机制,传统 Transformer 架构不再是唯一的选择。这个模型的参数量高达 4560 亿,其中单次激活 459 亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长 400 万 token 的上下文,是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

受益于架构的创新、效率的优化、集群训推一体的设计以及内部大量并发算力复用,MiniMax 提供文本和多模态理解的 API 的标准定价是输入 token 1 元/百万 token,输出 token 8 元/百万 token。。(来源:MiniMax)

 

《王者荣耀》纯血鸿蒙 HarmonyOS NEXT 版明日 10 点正式上线,支持 120 帧刷新率、跨平台匹配、账号互通与继承

1 月 15 日消息,据王者荣耀官方消息,《王者荣耀》HarmonyOS NEXT 版本的适配工作已完成,将于 2025 年 1 月 16 日 10 点上线鸿蒙 HarmonyOS NEXT 应用市场。

《王者荣耀》HarmonyOS NEXT 版功能介绍如下:

1、支持 120 帧高刷新率

  • 在支持高刷新率的鸿蒙设备上,王者游戏画面可以达到 120 帧的超高刷新率,带来更加流畅的游戏体验。

2、跨平台匹配

  • 鸿蒙系统用户可以与其他平台 (安卓、iOS) 的玩家进行跨平台匹配。

3、账号互通与继承

  • 原安卓账号与鸿蒙系统互通,系统安心切换,账号无缝衔接,畅享王者荣耀丝滑体验!
  • 无需重新注册,完整保留所有游戏资产。(来源:IT 之家)

OPPO Find X8 Ultra 渲染图曝光:外观设计基本保持不变

据知名数码博主 @ 定焦数码 最新发布的信息显示,与此前曝光的消息基本一致,全新的 OPPO Find X8 Ultra 在外观上将延续此前 OPPO Find X8 系列的设计,其后置相机模组依旧为对称设计,哈苏的标志位于影像模组中间。

值得注意的是,此前 OPPO Find 系列产品负责人周意保也曾在回复网友时透露,OPPO Find X8 Ultra 将与另外两款 Find X8 系列机型保持一致,并配备实体拍照按键,让拍照更加方便。

其他方面,根据此前曝光的消息,全新的OPPO Find X8 Ultra将会配备一块2K分辨率的OLED曲面屏,搭载高通骁龙8至尊版移动平台。将后置四摄,其中包括一颗索尼LYT 900传感器的5000万像素1英寸超大底主摄、两颗5000万像素的大底潜望式长焦镜头和一颗5000万像素的大底超广角镜头。

此外,该机一次性塞进了两颗潜望长焦,其优势在于用户不必局限于单个镜头在3倍或5倍范围二选一,而是同时能在3倍至6倍的范围内实现丝滑变焦。

据悉,全新的 OPPO Find X8 Ultra 将会在 3 月与大家见面,预计价格会进一步上涨,考虑到前代定价为 5999 元起,这次该机的起售价可能超过 6000 元。(来源: TechWeb)

 

三星 Galaxy S25 Slim 细节曝光:厚度仅 6.5mm 对标 iPhone 17 Air

日前三星官方正式宣布,作为安卓机皇的三星 Galaxy S25 系列将于 1 月 23 日正式发布。有外媒进一步晒出了该系列机型中新增的 Galaxy S25 Slim 的更多细节。

据海外知名爆料达人最新发布的信息显示,与此前曝光的消息基本一致,全新的三星 Galaxy S25 系列今年将新增一款轻薄版本机型——三星 Galaxy S25 Slim,其定位将介于三星 Galaxy S25+与三星 Galaxy S25 Ultra 之间,厚度相比此前已经得到不少曝光的 iPhone 17 Air 要稍厚一点,预计在 6.5mm 左右,而 iPhone 17 Air 的厚度为 6.2mm。

其他方面,根据此前曝光的消息,全新的三星Galaxy S25系列将首发搭载高通骁龙8至尊版for Galaxy处理器,CPU主频达到了史无前例的4.47GHz,同时该系列还将升级16GB内存,这将是三星史上内存最大的旗舰手机。

虽然三星Galaxy S25 Slim的机身非常轻薄,但三星还为其配备了S24 Ultra同款2亿像素摄像头ISOCELL HP2,超广角摄像头和长焦摄像头都将采用5000万像素的JN5传感器,同时将配备一颗支持3.5倍光学变焦的长焦镜头,并采用三星最新发布的ALoP(全透镜棱镜,All Lenses on Prism)技术。

三星将在 1 月 23 日举办 Unpacked 活动,届时全新的三星 Galaxy S25 系列将正式亮相,而新增的 Galaxy S25 Slim 版可能要到 4 月才能发布。(来源: TechWeb)

消息称任天堂 Switch 2 将配备神秘「C 键」,首次引入群聊及语音聊天功能

1 月 15 日消息,本月中旬曾有消息称任天堂将于 1 月 16 日发布 Switch 2,尽管这一日期正不断接近,但相关的泄露信息仍源源不断地流出。这次的爆料来自 Nintendo Switch 2 的 Discord 服务器,该频道上的数据挖掘者昨日宣称发现了一个新功能,似乎与右侧 Joy-Con 上的神秘「C 键」有关。

代码提到了一个名为「Campus」的新功能。据悉,这一功能将首次为 Switch 引入群聊和语音聊天且支持屏幕共享,支持最多 12 个 Nintendo Switch Online 用户同时在线,暗示它可能与付费订阅服务相关。由于群聊和语音聊天需要网络连接,如果 Switch 2 要提供这些功能,就很可能只会提供给 NSO 订阅用户。(来源:IT 之家)

 

每年 CES 都在产生共识,今年的共识是「端侧 AI」

上周刚刚结束的 CES 2025,共计吸引了 4000 余家厂商以及超过十万名观众参展,统观活动和展览的全程,从内容丰富程度来看,仍然无愧于「全球最大消费电子展」的名号。

 

但真正让 CES 配得上「消费电子届春晚」的,除了各家厂商都会展示的不少「花哨」新技术,还有隐藏在其中的,但仍能被捕捉到的「年度趋势」。

从 CES 每个人讨论最多的话题,到现场各种产品展台前受关注的情况,就不难判断出接下来一整年内,全球消费电子产业将会出现的重要变革。对于未来趋势的预判,通过 CES 这个全球各地消费电子从业者交流的平台,在真正意义上变成「共识」,带回世界各地生根发芽。

比起 CES2024 上每个人都在兴奋地讨论「AI 硬件」,CES2025 的现场少了几分因为看不清 AI 硬件的发展前景、而在兴奋中夹杂着茫然的狂热,讨论中多了不少明确的指向性。

今年的 CES 现场,众多具有试水性质的 AI 硬件产品逐渐变得无人问津,已经被初步验证过的 AI 眼镜、AI 智能宠物等产品品类的展台前,体验产品与咨询产品相关信息的用户大排长龙。

在产品功能展示中,端侧 AI 因为实时响应速度更快、成本更加可控,迅速脱颖而出,成为今年不少新品 AI 功能的主要卖点,并且通过各种基于端侧 AI 实现的多模态内容识别、或是端侧数据分析等能力,给现有的硬件体验带来改变。

如果说去年的共识是「AI 硬件是未来」,那 CES2025 中诞生的这个共识,无疑是「端侧 AI,才是 AI 硬件的未来」。

 

01

 

端侧 AI——AI 硬件落地的关键

 

在刚刚结束的 2024 年,AI 硬件快速发展。从通用的 PC 和手机终端,到机器人、眼镜、耳机,再到更多更细分的垂类赛道,几乎每一种存在人机交互的硬件终端,都有厂商尝试将其与大模型结合。

最常见的是方案调用云端算力完成 AI 推理——这在基础大模型快速迭代,开发者还在探索 AI 能力与硬件结合的阶段更加实用。但当 AI 硬件走出企业的研发中心,开始面向消费者时,只有云端 AI 的方案面临三个挑战。

 

  1. 调用云端算力的成本居高不下
  2. 网络传输导致 AI 在终端的响应速度较慢
  3. 数据隐私问题,用户在关注隐私安全的同时,也希望终端 AI 能提供更个性化的服务

 

过去一年,行业逐渐形成共识:端侧 AI 将是 AI 硬件落地的关键,这点在 CES2025 期间得到更进一步的印证。

以今年最火热的人形机器人赛道为例:CES 期间发布的机器人,不少在外观设计上愈发贴近人类,但它们在动作灵活性、智能感知与决策,以及交互体验等核心领域,依然存在较大的提升空间。

究其原因,人形机器人的研发瓶颈集中在三大关键部分:负责自主学习/决策的「大脑」,掌控跑跳、抓取等复杂动作的「小脑」,以及由躯干四肢组成的本体」。这些核心部位的技术突破,直接决定了机器人的整体性能。

阿加犀展示的、以端侧 AI 技术为基础的人形机器人,通过使用高通端侧 AI 处理器支持部署端侧大模型,赋予机器人强大的端侧多模态处理能力,将视觉、听觉、触觉等多种感官输入深度融合,结合端侧 AI 的高能效优势、实现高效的端侧实时数据处理,为机器人提供更流畅、更精准的交互体验。

在体验中,阿加犀这款人形机器人能轻松完成智能交互,它能够用流利的英语「Welcome to the Qualcomm booth!」问候走近的参观者,与用户流畅自然地规划,并且准确地提供服务。

在高通展台展示的阿加犀人形机器人|图片来源:极客公园

除了高性能和低延迟以外,隐私安全也是端侧 AI 的主要价值之一。极客公园在 CES 现场注意到,在各家汽车厂商的智能驾驶展台中,面对车中部署的众多摄像头,会有很多观众问出「这些摄像头收集到的驾驶员/乘客个人隐私数据如何进行处理」这样的问题。

相比今天主要运用于 B 端的机器人,智能汽车属于用户私人所有,把数据全都传到云端,用户难免会担心隐私数据的泄露。

相对于云端 AI,端侧 AI 更适合解决这样的顾虑。终端侧 AI 从本质上有助于保护用户隐私,因为查询和个人信息完全保留在终端上,即使是与车载智能语音助手进行沟通,也能通过端侧 AI 得到需要的信息,在保护隐私的同时无损于用户的智能化体验。

在 CES 期间,笔者在高通展台看到了车机系统的端侧 AI 解决方案,例如打通支付系统,将支付信息保存在本地;此外还可以在车机系统中整合各种常用的在线服务,例如匹配用户生物特征信息,完成在充电站充电后,自动支付充电费用,「拔枪即走」,或是直接在车上点餐、订购流媒体服务等场景需求。

高通在 CES 期间展示的骁龙数字底盘概念车|图片来源:极客公园

 

整个过程中能看到,无论是算力调用还是数据处理,都以端侧的 AI 算力作为「主场」,只有在必要的情况下向云端请求相关数据,或是在面临复杂任务时向云端分流任务。

在「离用户最近的地方完成数据处理」也能在车辆驾驶这样情况复杂的辅助驾驶场景下,显著降低驾驶员分心的可能,将信息以最高效的方式,传递给用户。

从 CES 现场硬件产品的发展趋势来讲,这一点对于 AI 进一步深入更多用户场景,有着比想象更多的可能性:大量如今不得不依赖云端推理才能完成的请求能在端侧完成,这将在全球范围内带来成本的大幅降低:每一个时代最流行的产品,一定也是普通人能负担得起的产品,这一点同样重要。

更强的端侧 AI,不仅能更好地保护用户隐私,同时也在为更加聪慧的主动智能奠基:用户在 PC、智能手机乃至智能眼镜、汽车中,都有愈发强烈的「让 AI 主动帮我处理一些工作」的趋势,尤其是对于手机/笔电这样需要使用自带电池运行的设备来讲,这不仅意味着更大的数据处理量,同时也对硬件本身所采用的芯片功耗提出了更高的要求。

AI PC 能够在端侧调用本地模型的算力,处理更多 AI 大模型任务|图片来源:极客公园

性能、隐私、成本三大优势的加持下,今年在 CES 现场,无论是中国厂商百花齐放的「百镜大战」,还是 AR/VR 头显新锐厂商发布的各具亮点的产品,都能看到相关厂商选择引入端侧 AI 解决方案。

事实上,在 2024 年,我们其实已经观察到这一趋势,无论是掀起 AI 眼镜浪潮的 Ray-Ban Meta,还是各家主打端侧 AI 能力的智能手机与 AI PC,都离不开以高性能和高能效为核心优势的高通芯片的支持。

在笔者与现场硬件创业者的沟通中,「我们用的是高通的方案」是听到次数最多的产品介绍之一,这甚至已经成为了一种无需更多介绍的产品背书,只要听到这句话,双方对于这款产品在端侧 AI 性能基准上应该拿出怎样的表现,就有了一个相对的心理预期,无论是在 XR、AI PC、智能汽车还是机器人领域都是如此。

在 CES 上,高通公布的最新数据是,搭载骁龙 X 系列平台的 AI PC 已经超过 60 款,预计到 2026 年这个数字将超过 100 款,这些 PC 来自你能想到的几乎所有主流 Windows PC 厂商;零跑汽车、极氪、德赛西威、Garmin 佳明和松下汽车等汽车产业链厂商都宣布了基于骁龙座舱平台的合作,而高通此次带来十余项的汽车合作动态,更是囊括座舱、智能驾驶、甚至还有电动摩托车等领域;索尼、三星、Rokid 和雷鸟等厂商,都在展会期间带来了使用骁龙 XR 产品线的空间计算新品。

 

观众在 CES 上体验 XR 产品|图片来源:极客公园

 

正是因为有了携手多领域终端厂商打造的丰富品类的 AI 硬件,让高通这样一家 To B 企业的展台反而成为了 CES2025 硬件产业链上存在感最强的厂商之一。

 

02

 

从 AI 到 Agent UI

 

端侧 AI 已经成为共识,而如果从 CES2025 现场各家厂商各类产品的展示,推测 2025 年 AI 硬件的下一个趋势,那一定是 Agent UI 的普及与推广。

从最早以应用为核心的 Apple Macintosh 搭载的 systems1 系统算起,以应用程序为核心的操作系统逻辑已经诞生并进化了四十余年,以至于我们很容易混淆,直接将其与「智能操作系统」画上的等号。

但在 CES 现场,你会听到众多不一样的回答:无论是行业领袖在 CES 开幕前的主题演讲,还是高通所强调的「AI 是新的 UI」观点,亦或是现场硬件/软件创业者的探讨中都能发现,Agent UI 取代传统操作界面 UI,将会是 AI 硬件时代带给所有硬件产品影响最深刻的变革之一。

或许很快,我们目前熟悉的车机、手机桌面等概念,都将被全新的、以AI为主要交互方式的 UI 取代,从而让系统从「App 的主场」,变成「AI 的主场」,这就是 Agent UI 的核心所在。

Agent UI 并不是「AI 语音助理」的直接迭代:它的诞生源于业界越来越多意识到,更聪慧的智能体验需要依赖全新的架构,来强化 AI 的决策、交互与适应能力——这些要求对目前众多仅靠大模型本身实现 AI 功能的硬件来讲,是难以逾越的天花板。

这一趋势同样离不开端侧 AI 算力的深入:从笔者在 CES 2025 现场看到的情况,无论是本田、宝马这样的传统车企,还是 Waymo、Rivian 这样的新锐厂商,都将「从车载助理,到基于 AI 重新设计车机交互」当作了主要的演讲主题与展示内容。

 

在智能座舱中应用 Agent UI 实现的效果|图片来源:极客公园

在高通在其 CES 展台展出的骁龙数字底盘概念车中,Agent UI 取代传统操作界面给交互体验带来的改变已经初现雏形:除了最基本的时速等信息,驾驶员一侧的显示屏幕内容几乎全部被 AI 智能助理取代,传统的 App 不见踪影,取而代之的是 Agent 接收各种来自驾驶员的指令、并顺畅完成任务。

除了车机系统,智能眼镜其实是更早向我们展示 Agent UI 未来前景的硬件品类。去年现象级的智能眼镜 Meta Rayban,由于没有传统的图形 UI 和手势识别、操作手柄等智能眼镜产品场景的交互控制器,从一开始就依赖于语言指令。

一开始这种交互还比较单一,只能执行用户的拍照、放歌等简单命令,这时候更像是手机智能助手的翻版,还很难称得上是下一代的 Agent UI。但随着 Meta Llama 大模型的不断升级,从 2024 年年中开始,越来越多用户开始与 Meta Rayban 进行更复杂的交互,包括翻译、计算卡路里、去博物馆识别物体并进行讲解等等。

通过与 Agent 进行语音交互,让智能产品在各个场景下提供服务,此时的 Meta Rayban 已经有了新一代 UI 的雏形。而在 CES 2025 期间,我们观察到了更多的尝试。

比如搭载第一代骁龙 AR1 处理器的雷鸟 V3,同样在 AR 眼镜体验中融入了 Agent UI 的概念:借助端侧 AI 计算,雷鸟 V3 能实现平均 1.3 秒的 AI 响应速度;在新架构的支持下,更多即将上线的新功能,包括手机通知 AI 总结播报、录音内容 AI 总结、AI 新闻播客等,都能通过更强的端侧算力,给用户实际使用带来更好的体验。

 

03

 

结语

 

虽然站在当下,我们对未来的畅想并不总是会变成现实,但如果结合足够多的真实用户反馈,自然能看到未来的产品进化趋势,以及今天在追求、终有一天能到达的那个「终点」。

如果全行业都同时认可一个想法,那它极大概率真的会变成一个「趋势」,并最终孕育出新的未来。

这某种程度上也是 CES 独特的魅力之一:这里不是「巨头通吃一切」的战场,也不是谁有钱租得下华丽展位就能吸引到来自用户最多的目光,而是通过产品和技术赢得用户传达出的最真实的反馈。

在通过端侧 AI 提供解决方案的基础上,各家使用高通平台的终端品类在云端模型应用上仍然呈现出「百花齐放」的状态,通过「云+端」的混合 AI 模式,面向不同应用场景、不同用户需求灵活采用对应的处理方式,最终诞生我们在 CES 2025 上看到的一款款展台前人满为患的爆款产品。

那些在 CES 现场人头攒动、几乎堵得水泄不通的展台,是产品是否真正受到用户关注的最佳回答。

虽然 CES2025 已经结束,但在这几天内来自世界各地的行业从业者们所形成的「端侧 AI 是共识」,会随着接下来一整年之中一批批的 AI 硬件发布而不断强化,真正推动行业发展。

 

❌