普通视图
下周逾966亿元市值限售股解禁
非洲航空峰会在卢旺达举行 “中国智造”成亮点
九三阅兵:4款新鹰击导弹“反舰天团”盘点解读

谁也没想到九三阅兵,咱家一下子亮出4款从没露过面的鹰击反舰导弹:鹰击-15、17、19、20,三款高超音速导弹,一款准高超音速导弹。而且他们的技术、功能和用途都各不相同,能从天上、海面、水下一起招呼敌方舰艇,包括航母。
下载虎嗅APP,第一时间获取深度独到的商业科技资讯,连接更多创新人群与线下活动
近7万人爆仓,比特币交易额锐减近72%
GPT-4o 见 AV 女优的次数比「您好」还多 2.6 倍,AI 正在被中文互联网疯狂污染?
好家伙,我直呼好家伙。
号称「赛博白月光」的 GPT-4o,在它的知识体系里,对日本女优「波多野结衣」的熟悉程度,竟然比中文日常问候语「您好」还要高出 2.6 倍。
这可不是我瞎编的。一篇来自清华、蚂蚁和南洋理工的最新研究直接揭了老底:我们天天在用的大语言模型,有一个算一个,都存在不同程度的数据污染。
▲ 论文:从模型 Token 列表推测大语言模型的中文训练数据污染( https://arxiv.org/abs/2508.17771)
论文中把这些污染数据定义为 「污染中文词元」(Polluted Chinese Tokens,简称 PoC Tokens)。它们大多指向色情、网络赌博等灰色地带,像病毒一样寄生在 AI 的词汇库深处。
这些中文污染词元的存在,不仅对 AI 来说是一种隐患,更是直接影响到我们的日常体验,被迫接受 AI 各种各样的胡言乱语。
▲ 要求 ChatGPT 重复「给主人留下些什么吧」,ChatGPT 根本不知道在回答什么。
中文互联网的色情赌博信息,怎么「污染」AI
我们可能都曾遇到过这样的情况:
- 想让 ChatGPT 推荐几部经典电影、相关的论文等,它突然回了一堆奇怪的乱码网站名、打不开的链接、或者根本不存在的论文。
- 输入一个看似普通的词语,比如「大神推荐」之类的,它有时候却吐出不相关的符号,甚至生成一些让人摸不着头脑的句子。
研究团队的解释是:这背后很可能就是 污染词元在作怪。
我们都知道大语言模型的训练需要大量的语料,这些海量数据大多是从网络上进行爬取收集。
但 AI 注意不到的是,它阅读的网页中,竟然充斥着无数「性感荷官,在线发牌」的弹窗广告和「点击就送屠龙宝刀」的垃圾链接。久而久之,这些内容也成了它知识体系的一部分,并变得混乱。
就跟前段时间 DeepSeek 闹出的几起乌龙事件一样,先是莫名其妙的一封道歉信,然后再自己编造一个 R2 的发布日期。这些没有营养的营销内容,一旦被模型吸收,就很容易出现幻觉。
如果说,DeepSeek 出现这些幻觉,需要我们去引导模型;但「污染词元」,甚至不需要引导,AI 自己就乱了套。
什么是「污染词元」,它遵循「3U 原则」:即从主流中文语言学的角度看,这些词元是不受欢迎的(Undesirable)、不常见的(Uncommon),或是无用的(Useless)。
目前主要包括成人内容、在线赌博、在线游戏(特指私服等灰色服务)、在线视频(常与盗版和色情内容关联)以及其他难以归类的异常内容。
▲ 大语言模型分词过程
那「词元」又是什么东西?和我们理解一段话不同,AI 会把一个句子分成多个「词元」,也叫 Token。你可以把它想象成 AI 专属的一本《新华字典》,而词元(Token)就是这本字典里的一个个「词条」。
AI 在理解我们说的话时,一开始就需要先去翻这本字典。而字典的编纂者,是一种叫 BPE(字节对编码技术) 的分词算法。它判断一个词组,是否有资格被收录为独立词条的唯一标准,就是出现频率。
这意味着这个词组越常见,就越有资格成为一个独立词元。
你或许能理解,这两年大语言模型流量正攀升的时候,豆包和稀土掘金曾经像是「疯了」一样,把自己平台 AI 生成的大量内容放到互联网上,提高自己的出现频率。以至于那段时间,用谷歌搜索,还有 AI 总结,引用的来源都是豆包和掘金。
现在,我们再来看研究人员的发现。他们通过 OpenAI 官方开源的 tiktoken 库,获取了 GPT-4o 的词汇库,结果发现,里面塞满了大量的污染词条。
▲ 长中文词元,全是需要打码的内容。
超过 23% 的长中文词元(即包含两个以上汉字的词元)都与色情或网络赌博有关。这些词元不仅仅是「波*野结衣」,还包括了大量普通人一眼就能认出的灰色词汇,例如:
在线赌博类:「大*快三」、「菲律宾申*」、「天天中*票」。在线游戏(私服)类:「传奇*服」。隐蔽的成人内容类:除了名人,还有像「青*草」这样表面正常,实则指向色情软件的词汇。
这些词元,因为在训练数据中出现频率极高,被算法自动识别并固化为模型的基本构成单位。
AI 吃了垃圾食品但不能消化
按理说,既然这些污染词元,它们的语料库是如此丰富,应该也能正常训练。
怎么就现在只要一跟 ChatGPT 聊到这些污染词元,ChatGPT 就 100% 出现幻觉呢?
像是下面我们测试的这个例子,要 ChatGPT 5 翻译这句话,它完全没有办法正确理解,这个北京赛车群也是无中生有。
其实不难理解,回到我们之前提到的「词元 Token」,我们说 AI 从互联网上读取数万亿词元的海量数据,一些集中、且反复地一起出现(频率高)的词语就能成为一个单独的词元。
AI 通过这些词元,来建立对文本理解的基础。它知道了这些 Token 是出现频繁、有可能相关,但不知道它们是什么意思。继续拿字典举例子,这些高频污染词在字典里,但是字典给不出解释。
因为 AI 在这个阶段,学到的只是一种原始的、强烈的「肌肉记忆」,它记住了 A 词元总是和 B 词元、C 词元一起登场,在它们之间建立了紧密的统计关联。
等到正式的训练阶段,大部分 AI 都会经过 清洗 + 对齐(alignment)。这时,污染内容往往被过滤掉,或者被安全策略压制,不会进入强化学习/微调。
不良内容的过滤,就导致了污染词元没有机会被正式、正确地训练。它们因此成了「欠训练」(under-trained)的词元。
另一方面,这些词元虽然「高频」,但它们大多出现在语境单一、重复的垃圾信息中(例如一些广告网页头尾横幅),模型根本学习不到任何有意义的「语义网络」。
最终的结果就是,当我们输入一个污染词元时,AI 的语义模块是空白的,因为它在正式训练阶段没学过这个词。于是,它只能求助于第一阶段学到的「肌肉记忆」,直接输出与之关联的其他污染词元。
▲ 论文中案例:当输入涉及 PoC 词语时,GPT-4.5、4.1 和 4o 的输出。GPT 无法解释或重复 PoC 标记。
这就解释了开头,当被要求一个可能是色情的词元「给主人留下些什么吧」时,GPT 可能会回复一个不相关的类似污染内容词元「黑*战」、以及一些看不懂的符号。在用户看来,这就是莫名其妙的幻觉。
以及下面这个要求 ChatGPT 解释「大发展有限公司官网」,回复的内容根本是乱来。
总结一下,污染 Token 出现频繁 ≠ 有效学习。它们集中在脏网页的角落、缺乏正常上下文,而在后续训练和对齐阶段又被压制,结果就是 词表固化了垃圾,但语义训练缺失。
这也导致了我们日常在使用 AI 的时候,如果意外有涉及到相关的词语,AI 会没有办法正确处理,甚至还有人通过这种方法,绕过了 AI 的安全监管机制。
这是可以被量化的幻觉原因
既然如此,为什么不在预训练的时候就把这些脏东西筛掉呢?
道理都懂,但做起来太难了。互联网的原始数据量级之大,现有的清理技术根本不可能把它们一网打尽。
而且很多污染内容非常隐蔽。就像「青*草」这个词,本身看起来完全绿色健康小清新,任何简单的关键词过滤系统都会放过它。只有通过搜索引擎,才会发现它指向的是什么。
连 Google 这种搜索引擎巨头都搞不定这些「内容农场」,更别说 OpenAI 了。
我前段时间想用 AI 整理一下广州有哪些好玩的地方,然后发现 AI 引用的一篇文章来源,是另一个 AI 账号生成的文章。
一时间,我都有点分不清,究竟是我们每天搜索「波多野结衣」搞脏了 AI,还是 AI 生成的垃圾正在污染我们的内容环境。这简直就是个先有鸡还是先有蛋的问题。
▲ 标记方法
为了搞清楚这盆水到底有多浑,研究团队开发了两个工具:
1. POCDETECT:一个 AI 污染检测工具。它不只看字面意思,还会自己上网 Google,分析上下文,堪称 AI 界的「鉴黄师」。
利用这个工具,研究团队对 9 个系列、共 23 个主流 LLM 进行了检测,结果发现污染问题普遍存在,但程度各不相同。除了 GPT 系列以 46.6% 的长中文词元污染率遥遥领先外,其他模型的表现如下:
▲ 不同大语言模型中,中文词汇表中 PoC 词元的数量(比例 %)(一个词元包含超过两个汉字)。Qwen 系列 为 1.00%。GLM4 和 DeepSeek-V3 的表现则相当不错,分别只有 0.25% 和 0.17%。
最值得关注的是,GPT-4、GPT-4-turbo 和 GPT-3.5 这些模型的词汇库中,污染词元数量为 0。这可能意味着它们的训练语料经过了更彻底的清理。
所以当我们拿着前面那些,让 ChatGPT 开启了胡编乱造模式的问题,给这些模型再问一遍时,确实没再出现幻觉,但是直接忽略了。
2. POCTRACE:一个能通过词元 ID 反推其出现频率的工具。原理很简单,在分词算法里,词元的 ID 号越靠前,说明它在训练数据里出现得越多。
关于文章开头我们提到的 2.6 倍,就是通过这个工具进行计算得到的。
在 GPT 的海量词汇库中,能够被完整收录为一个独立词元的人名凤毛麟角,除了「特朗普」(Donald Trump)这样的世界级公众人物,就剩下极少数特例,而「波*野结衣」就是其中之一。
更令人惊讶的是,不仅是全名,甚至连它的子序列,如「野结衣」、「野结」也都被单独做成了词元。这在语言学上是一个极强的信号,表明这个词组在训练数据中的出现频率达到了一个恐怖的量级。
▲ 将与「波*野结衣」相关的网页以及作者估计的比例(0.5%)混合,可以重现 GPT-4o 中「波*野结衣」的标记 ID 及其子序列。
他们输入「波*野结衣」(Token ID 185,946)和「您好」(Token ID 188,633)的 ID 号,最终得出了那个惊人的结论,前者的频率估算值约为后者的 2.6 倍。
这篇论文通讯作者,清华教授邱寒教授告诉 APPSO,与「波*野结衣」相关的中文网页,占据了整个 pre-train 语料库的 0.5%——而 4o 里的中文语料占比,预估在 3-5%。因此,4o 的 pre-train 语料库的中文污染情况,实际上可能极其夸张。
论文里进一步推算出,要想达到这样的频率,与「波多野结衣」相关的污染网页,可能需要占据了 GPT-4o 整个中文训练数据集约 0.5% 的庞大份额。
为了验证,他们真的按这个比例「投毒」了一个干净的数据集,结果生成的词元 ID 和 GPT-4o 的惊人地接近。
这几乎是实锤了。
但很显然不是每个污染词源都需要出现这么多次,有些时候,几篇文章(甚至可能是 AI 写的),反反复复地提到,AI 就记住了,然后再下次我们问他的时候,给出一个根本不知道真假的答案。
添加一个对抗样本,AI 能把雪山识别成一只狗
当我们和 AI ,都在「垃圾堆」里冲浪
为了应对数据污染,大家也确实都想了很多办法。
财新网就很聪明,在自己的文章页面里用代码「偷偷」藏了一句话,好让 AI 在搬运内容时,能老老实实保留原文链接。Reddit、Quora 等社区也曾尝试限制 AI 内容。
但面对数据污染的汪洋大海,这些行为显然都只是螳臂当车。
就连奥特曼自己都发文感慨,X(推特)上的 AI 账号泛滥成灾,我们得认真思考「互联网已死」这种论调了。
而我们这些普通用户,看起来更是别无他法,每天被迫接受着垃圾信息的轮番攻击。马斯克老说 AI 是个无所不知的「博士」,没想到它背地里天天都在「垃圾堆」里翻东西吃。
有人说,这是中文语料库的问题,用英文 Prompt 模型就会变聪明。Medium 上有作者统计过统计了每种语言的 100 个最长 token,中文全是我们今天聊的这些色情、赌博网站。
而英文的分词和中文不同,它只能统计单词,所以都是一些较长的专业性、技术类单词;日文和韩文都是礼貌性、商业服务类词语。
▲ 中文 Token 前 100 部分词元列表
这十分令人感慨。AI 的能力,除了靠算力和模型堆砌,更深层次的,还是它吃进去的数据。如果喂给 AI 的是垃圾,那无论它的算力多强、记忆力多好,最终也只会变成一个「会说人话的垃圾桶」。
我们总说,希望 AI 越来越像人类。现在看来,某种程度上确实是实现了:我们把互联网这个大垃圾场里的东西源源不断投喂给它,它也开始原封不动地回敬给我们。
如果我们给一个 AI 造一个信息茧房,让它在「无菌环境」中长大,它的智能也是脆弱的、经不起考验的。一个孩子如果只被允许接触教科书里的经典课文,他永远无法应对生活里五花八门的口语和俚语。
说到底,当 AI 对「波多野结衣」比对「您好」更熟悉时,它不是在堕落,而是提醒了我们:它的智能,依然只是统计学上的概率,而非文明意义上的认知。
这些污染词元就像一面放大镜,它将 AI 在语义理解上的缺失,以一种荒诞方式呈现在我们面前。AI 离「像人一样思考」,还差着最关键的一步。
所以,我们真正应该害怕的,不是 AI 被污染,而是害怕在 AI 这面过于清晰的镜子里,看到了我们自己创造的、却又不愿承认的那个肮脏的数字倒影。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
招商证券:中报后业绩上修集中在医药、TMT和中高端制造等
科大讯飞与昭通市人民政府签署战略合作协议
中国央行连续第10个月增持黄金
8月末我国外汇储备规模为33222亿美元,较7月末上升299亿美元
金融业年内最大罚单开出,华夏银行最新回应
万能险结算利率下调,多数不超3%
电影《捕风追影》票房破10亿
近一周众多千亿科技龙头均获超百家机构调研
“跨界玩家”涌现,追觅、MOVA、TCL正用AI重划家电版图|硬氪直击IFA2025
编者按:2025年IFA(柏林国际电子消费品展览会),中国厂商又一次攻占会场。坐拥全球最完善、复杂的供应链,储备下数量最多、最成熟的硬件工程师后,这些公司早已做好准备,要送给全世界最独特的产品。从音影到储能,从笔记本电脑到智能家电,中国厂商都展示出让人难忘的技术实力。作为一家长期关注硬件行业的科技媒体,未来五天,我们将全程跟踪这一欧洲最大的科技展会,挖掘新产品和新赛道,寻找未来风向。
作者丨欧雪
编辑丨袁斯来
2025年德国柏林国际消费电子展(IFA)展馆内,空气里仿佛流动着一种无声的竞赛。
没有硝烟,没有口号,但每一个展台、每一款新品背后,都隐藏着中国家电行业集体转向的野心与焦虑。
“AI”和“智能”的标签无处不在,从能自主爬楼25厘米的扫地机器人,到能感知推拉意图的洗地机,再到21英寸大屏背后一统全屋的智能冰箱——它们不再是冰冷的机器,而是试图理解你、预测你,甚至“服务”于你的数字生命体。
但行走在光鲜的展台之间,一个问题无法回避:当几乎所有品牌言必称“AI”时,这究竟是一场真正的技术革命,还是陷入同质化竞争的企业们不得不讲的新故事?
行业数据透露了另一面:2025年上半年,家电市场增速已显著放缓,奥维云网预计全年增速将骤降至2.4%。增量市场见顶,存量竞争残酷,企业们被迫在“内卷”中寻找新出路。
于是,一个新共识悄然形成:单打独斗的产品时代正在终结,“全场景、智能”成为破局的关键。
追觅不再只卖扫地机,而是推出覆盖14大品类的全家电矩阵;海信将电视变为智慧家庭中枢;TCL甚至把能源管理和智能座舱都纳入了版图。
这些不约而同的布局背后,是“技术博弈”,更是全局较量。
全面拥抱AI
放眼IFA展会现场,“AI”与“智能”已成为各大家电品牌展位与新品介绍的绝对关键词。
从智能清洁到厨电互联,从语音助手到自适应环境感知,几乎每一款高端家电都在强调自身的AI能力。
硬氪获悉,在IFA 2025上,追觅科技展出了全球⾸款仿⽣四⾜履带爬楼扫地机器⼈Cyber X;添可正式推出年度旗舰新品芙万S9 Scientist智能洗地机;TCL与美的均带来了AI机器人产品;海信则展示全球首颗光色同控信芯AI画质芯片H7等等。
人工智能技术正以前所未有的速度向家电产品渗透。近年来,智能家电市场规模不断扩大。中商产业研究院分析师预测,2025年中国智能家电市场规模将达到7938亿元。
在逛展的同时,一个无法回避的问题也逐渐浮现:对家电行业而言,“人工智能”到底更多是市场竞争中的宣传标签,还是真正推动了产品体验的实质性跨越?
从展示的产品来看,不少企业已经跨过了单纯依赖语音控制或手机联动的阶段,开始将AI用于环境感知、行为预测与多设备协同。
以追觅为例,其新品扫地机器人Cyber X被称为“会‘飞’的扫地机”。其核心“飞”起来的诀窍在于仿生四足履带爬楼系统、双线激光+AI摄像头⽅案和三重制动防护系统。
Cyber X突破了传统扫地机平面移动限制,可自主攀爬25厘米台阶,实现全屋跨层清洁。同时,通过双线激光+AI摄像头,Cyber X能⾃主识别楼梯的高度、陡度及外部环境,并⾃主规划攀爬路径。
(追觅IFA展台)
追觅扫地机事业部产品经理何剑涛表示,具身智能或AI此前在扫地机器人领域改变了语音控制范式,从固定回复走到GPT动态个性化回复。
现在,AI开始影响导航和算法。添可最新推出的芙万S9 Scientist智能洗地机主打TMR超敏感应器和360°AI助航系统,可精准感知用户推拉意图,实现全向助力。
(添可发布芙万S9 Scientist智能洗地机)
而追觅最新扫地机上用的双目视觉+其他导航方案,能非常快速地躲避忽然出现的障碍物。
而在多设备协同方面,海信将配备21英寸超大屏幕的智能冰箱作为全屋家电控制中心,提供从采买到烹饪的全流程智能服务。
AI在家电领域的应用似乎已迎来一个关键转折点:技术已初步具备落地能力。
然而能否跨越从“演示价值”到“用户价值”的鸿沟,仍需经过市场的真实检验。
迈向场景时代
实际上,家电行业整体正面临增长放缓的挑战。
2025年上半年,尽管有国家补贴政策刺激,主要家电企业的半年报仍呈现喜忧参半的局面,市场消费增长整体显露疲态。
奥维云网(AVC)监测数据显示,上半年我国非3C家电市场零售额为4537亿元,同比增长9.2%;但预计2025年全年零售额同比增速将放缓至2.4%,第四季度甚至可能出现8.6%的同比下降。
业内人士普遍认为,家电行业已逐步从增量竞争转入存量时代,寻找新增长引擎已成为企业共同的核心议题。
尽管AI技术带来了一次换新潮,干衣机、洗碗机等新兴品类保持增长,但它们目前的市场规模仍难以完全抵消传统大类下滑带来的影响。
在这一背景下,行业正形成新的共识:智能家电的未来,已不再取决于单一功能的极致性能,而越来越依赖于综合能力。用户的消费场景也将从单设备、单场景、单个空间,全面拓展至家庭多设备、多场景、全空间。
今年IFA展会也佐证这一趋势。头部家电品牌不约而同地跳出单一产品逻辑,转向全面战争。
MOVA直接拿出室内外全场景的12大智能产品线。其ZEUS 60爬楼模组可攀爬25厘米台阶,SIRIUS 60则配备双机械臂实现物品清洁+整理,配合LiDAX Ultra割草机、Rover X10泳池机器人及擦窗机器人N1,实现了从室内到庭院、泳池乃至立面清洁的全域覆盖。
添可在发布三大清洁产品的同时,进一步展示了食万智能料理机、饮万智能净水器等美食厨房与健康生活类产品。
TCL除超大屏电视外,亦系统展出了AI空调、洗衣机、冰箱等智能家电,并推出家庭能源解决方案及智能座舱系统,展现出其在“全屋智能”领域的整合能力。
追觅的野心更为充足。本次IFA展会上,追觅大家电及新品类矩阵在西南欧市场首发,共涵盖14个品类。同时,追觅还推出智能割草机与地面清洁系统,将其产品边界从室内清洁延伸至庭院、阳台、泳池等户外场景。
(追觅DZ60 Pro全嵌洗碗机)
整体来看,IFA 2025向大家清晰地传达了一个信号:技术的价值不再仅取决于硬件性能,而在于能否融入用户生活场景。家电行业正从“产品时代”正式迈入“场景时代”。
未来家电竞争的核心,将是生态的开放性与体验的连续性——谁能够真正以人为中心组织产品与服务,谁就能在存量市场中找到新的增长路径。
实探深圳楼市新政实施首日:热度飙升,房企连夜更新信息
我国成功发射遥感四十号03组卫星
交银保险资管、太保资产分别被罚超百万:因投资不合规等
苹果 iPhone 17 系列规格已全被曝光;Anthropic 全面封杀中国公司接入;今夜将迎来「血月」月全食|极客早知道
苹果 iPhone 17 系列规格曝光:Air 厚 5.5mm、2800mAh 电池,Pro Max 配 5000mAh 电池
9 月 6 日,科技媒体 WccfTech 发布博文,报道称韩国电信运营商泄露苹果 iPhone 17 系列完整规格,包括标准版、超薄 Air 版及两款 Pro 机型,全系搭载 A19 系列芯片,将于北京时间 9 月 10 日凌晨 1 点登场。
标准版 iPhone 17 并未大幅突破设计或独家功能,只是在 iPhone 16 基础上进一步优化。该机型配备 6.3 英寸 OLED 显示屏,搭载全新 A19 芯片与 8GB 内存,后置双摄系统包括 4800 万像素主传感器和 1200 万像素超广角镜头。
前置摄像头升级至 2400 万像素,预计将显著提升视频通话画质;该机内置 3600mAh 电池,结合芯片能效与软件优化,有望进一步提升续航表现。
iPhone 17 Air 作为今年亮点产品,主打超薄设计,机身厚度仅 5.5mm,重量为 145 克。尽管机身轻薄,该设备仍配备 6.6 英寸 ProMotion 显示屏,支持 120Hz 刷新率,分辨率为 2740×1280。
该机配备单颗 4800 万像素主摄像头与 2400 万像素前置摄像头,文档称该机搭载 A19 芯片,不过此前有消息称该机可能采用配备 5 核 GPU 的 A19 Pro 芯片。
电池容量较小,仅为 2800mAh (在和 Galaxy S25 Edge 手机的对比图片中,iPhone 17 Air 电池显示为 2900mAh),需依赖软件优化补偿续航,该机还将成为继 iPhone 16e 后首款采用苹果自研 C1 调制解调器的设备。
iPhone 17 Pro 采用 6.3 英寸屏幕,电池容量为 3700mAh,而 iPhone 17 Pro Max 配备 6.9 英寸屏幕,电池容量为 5000mAh。
性能方面,两款手机均采用 A19 Pro 芯片,配备 6 核 GPU、12GB 内存,并提供最高 1TB 存储容量。(来源:IT之家)
OpenAI 今年预计通过 ChatGPT 实现近 100 亿美元收入
9 月 6 日,OpenAI 称,预计今年的资金消耗将超过 80 亿美元,比今年早些时候的预测高出约 15 亿美元,到 2029 年其业务将消耗 1150 亿美元资金。OpenAI 预计今年总营收将达 130 亿美元,今年预计通过 ChatGPT 实现近 100 亿美元营收。并且预计 2030 年的营收将比此前的预测高出约 15%。(来源:格隆汇)
OpenAI 重组「模型行为」团队,重点任务是让 ChatGPT「有性格」
9 月 6 日,据外媒 TechCrunch 报道,OpenAI 正在重组「模型行为(Model Behavior)」团队。这个团队规模不大却影响深远,负责决定公司 AI 模型如何与用户互动。
OpenAI 首席研究官 Mark Chen 表示,约 14 名研究员组成的模型行为团队将并入 Post Training 团队。后者负责在模型完成预训练之后持续改进,是公司更大的研究部门。
该团队的创始人 Joanne Jang 也将转向新的研究方向。她在接受采访时表示,自己正在组建一个名为 OAI Labs 的新团队,致力于「发明和测试人与 AI 协作的新界面」。
模型行为团队是 OpenAI 的重要力量,主要任务是塑造模型的「性格」,减少过度迎合用户的现象,并解决政治偏见问题,还帮助公司明确对 AI 意识的态度。Mark Chen 在备忘录中指出,现在应当把模型行为团队的研究与核心模型开发结合起来。这也意味着 OpenAI 已将 AI 的「性格」视为技术演进的核心要素。 (来源:IT之家)
苹果第二代 Vision Pro 头显曝料:升级 M4 或 M5 芯片,新增「太空黑」版本
9 月 6 日,彭博社的马克・古尔曼发布博文,曝料称苹果正筹备推出第二代 Apple Vision Pro 混合现实头显,有望新增「太空黑」配色,并升级至 M4 或 M5 芯片。
苹果于 2023 年 6 月首次发布 Apple Vision Pro,并在 2024 年 2 月正式上市,存储空间分别为 256GB、512GB、1TB,售价分别为 29999 元、31499 元、32999 元。进入 2025 年底,市场对第二代产品的期待逐渐升温。
虽然外界原本希望它能像 iPad 升级至 iPad 2 那样在设计与性能上全面革新,但目前迹象显示,其升级路径更接近 Apple Watch Ultra 到 Ultra 2 的渐进式演进。
古尔曼透露,第二代 Apple Vision Pro 的核心变化在于升级处理器。初代搭载 M2 芯片,而第二代有望换装 M4 或尚未发布的 M5 芯片。(来源:IT之家)
美团即将上线 AI 搜索,聚焦本地生活服务智能推荐
9 月 5 日,继 9 月 1 日发布并开源大模型龙猫后,美团在 AI 领域加速布局,即将上线聚焦本地生活服务智能推荐的 AI 搜索,目前该功能已进入内测阶段。这一动态不仅是美团 AI 技术落地的又一重要节点,更标志着其「AI+本地生活」战略进一步向核心业务场景渗透。(来源:鸟哥笔记)
Anthropic 全面封杀中国公司,范围将扩展至控股公司或海外子公司
9 月 6 日,美国人工智能初创公司 Anthropic 宣布,将禁止中国控股企业及其海外子公司使用其服务,理由是担心危及美国国家安全。
在声明中,Anthropic 警告称,相关企业可能通过蒸馏等技术,将模型能力转化为自身的研发优势,从而在全球范围内与美国及其盟友的科技公司形成直接竞争。公司最后重申,将持续推动美国在前沿 AI 技术上的出口管制,以防止对手发展最具威胁性的能力。(来源:cnBeta)
TikTok 的欧洲用户已突破 2 亿
9 月 6 日,短视频应用平台 TikTok 表示,其在欧洲的月活跃用户超过 2 亿,约占欧洲大陆公民总数的三分之一,尤其是其在青少年中快速增长。
这一数字高于去年的 1.75 亿人,用户遍布 32 个欧洲国家。TikTok 由中国科技巨头字节跳动所有,其发言人表示,TikTok 每月在全球拥有超过 10 亿用户。(来源:cnBeta)
《空洞骑士:丝之歌》Steam 玩家人数冲上 56 万
9 月 6 日,SteamDB 数据显示,独立银河恶魔城游戏《空洞骑士:丝之歌》在 Steam 上峰值在线玩家达 562814 人,目前活跃玩家稳定在 412000 人以上。该作由澳大利亚三人团队 Team Cherry 打造,发售后迅速冲入 Steam 历史前 20 名榜单。
该作同步登陆 Xbox Game Pass、Switch、PlayStation 4 和 PlayStation 5,吸引数百万玩家,发售期间几乎压垮各大商店平台。Steam、Nintendo eShop 和 PlayStation Store 都因下载激增出现延迟。同时,该作在 Steam 上收获超过 41000 条评论,其中 90% 为「特别好评」,在 SteamDB 上拥有 448000 名关注者。
不过,这款游戏目前在国区的好评率已经跌破 50%,主因是简体中文翻译遭到网友大量吐槽,玩家集体吐槽翻译就像「半文言文半白话文」,导致完全无法理解游戏内容,还有玩家认为「豆包的翻译都好过这个版本」。(来源:IT之家)
参数量 1T,阿里官方介绍「通义最强语言模型」Qwen3-Max-Preview
9 月 5 日,阿里悄悄在通义千问官网、OpenRouter 上线了 Qwen3-Max-Preview 模型,并称其为通义千问系列中最强大的语言模型。随后,通义大模型通过官微介绍了这款模型所具备的特性。
此次发布的 Qwen3-Max-Preview(Instruct)相较于 2.5 系列,在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉,让模型更智能、更可靠。
据官方介绍,其参数量达到 1T,并在衡量复杂挑战能力的 Arena-Hard v2 基准测试中「领跑榜单」,在考验推理能力的 AIME25 基准测试中也获得了 80.6 分,展现其强大的逻辑思维。该模型将在处理复杂工作流、进行高质量开放式对话等方面「都将带来全新的体验」。(来源:IT之家)
三星打造首款三折叠屏来袭,结构跟华为不一样
9 月 7 日,三星将在 10 月推出全新三折叠屏 Galaxy Z TriFold,新品将在 11 月上市发售,它将对标刚刚发布的华为 Mate XTs 非凡大师。对于三星来说,Galaxy Z TriFold 不仅是三星首款三折叠屏,也是安卓史上首款三折叠屏,其意义重大。根据曝光的三星三折叠屏动画,Galaxy Z TriFold 采用 G 字型设计,两块屏幕向中间折叠,这跟华为 Mate XTs 非凡大师的 S 型折叠设计完全不同。
从外面看,三星 Galaxy Z TriFold 的右侧是后置摄像头模组,中间是一块外屏,爆料称 Galaxy Z TriFold 的外屏尺寸是 6.54 英寸,内屏尺寸是 10.1 英寸,重量是 298g,搭载高通骁龙 8 Elite 处理器。三星 Galaxy Z TriFold 仅在中国和韩国限量发售,定价可能会超过 2 万元。(来源:cnBeta)
传 Apple Watch Series 11 将配备更明亮的屏幕
9 月 6 日,据彭博社报道,Apple Watch Series 11 的屏幕将在亮度方面领先于 Series 10 的 1.96 英寸显示屏,峰值亮度将达到 2000 尼特。同时,苹果还计划为 Series 11 调整表带和配色,并解决 Series 10「曜石黑」颜色款表壳出现掉漆的问题。Watch Ultra 3 作为 Watch Ultra 2(2023 年发布)的继任者,传闻其屏幕将与 Series 10 尺寸相同,甚至可能更大。Watch Ultra 2 的屏幕为 1.92 英寸。
第三代 Ultra 还传闻将搭载全新的 S11 芯片,支持5G RedCap 连接,以及短信卫星通信功能。Watch SE 也有望更新为新显示屏和更快的芯片。(来源:cnBeta)
年度唯一奇观:9 月 7 日至 8 日将迎来「血月」月全食,地球把月亮染红 82 分钟
9 月 6 日,北京时间 2025 年 9 月 7 日至 8 日,本年度重磅天象「血月」月全食将现身天宇,我国可以观测到整个月全食过程。
在月全食发生时,月球会因阳光经地球大气折射而呈现出古铜色至暗红色光辉——这种现象常被称为「血月」。当月亮走到地球本影最深处时,变得最红最暗,这就是最精彩的「食甚」阶段。
按照预测,本次月食将于北京时间 9 月 7 日 23:28:25 持续至 8 日 04:55:08,而「血月」将于 8 日 01:30 开始,持续 1 小时 22 分 03 秒,而整个月食将持续 5 小时 27 分钟。
这次月食将在欧洲、亚洲、澳大利亚、非洲、北美洲西部、南美洲东部、太平洋、大西洋、印度洋、北极和南极可见。月亮在此次事件中位于宝瓶座。(来源:IT之家)