普通视图

发现新文章,点击刷新页面。
昨天以前首页

苹果自研 AI 搜索曝光:核心团队大流失后,要把「灵魂」交给 Google

作者 莫崇宇
2025年9月4日 10:57

我已经算不清,苹果第几次承诺要让 Siri 变得更聪明了。不过,这回看起来苹果是真上心了。

据彭博社今天凌晨报道,苹果内部正在研发一套代号为 World Knowledge Answers(世界知识问答)的 AI 搜索引擎,准备整合进 Siri 里头。

而且不只是 Siri,Safari 浏览器和 Spotlight 功能以后也都要用上这套技术。

高管们给这个项目起了个挺唬人的名字——「答案引擎」,预计明年春天就要和 Siri 的重大升级一起发布。

说白了,传统搜索引擎主要是给「链接」,靠用户自己点开。

而苹果是要让 Siri 不仅具备全网搜索能力,同时跟 ChatGPT、Google 的 AI 概览一个路数,直接整合文字、图片、视频和本地信息,还配个 AI 总结系统。

据消息人士称,支撑新版 Siri 的底层技术,部分可能来自苹果的老合作伙伴 Google。

两家公司本周达成了正式协议,苹果将评估并测试 Google 开发的 AI 模型来增强 Siri。

要知道,Google 每年给苹果 200 亿美元,就为了让 Google 搜索成为 iPhone 的默认搜索引擎。现在苹果又要用 Google 的 AI 技术,这关系确实有点微妙。

报道中提到,苹果内部给 Siri 的技术改造起了两个代号:Linwood 和 LLM Siri。

负责软件工程的 Craig Federighi 最近在内部会议上表示,这次升级会超出预期:「这次端到端的 Siri 改造让我们拿到了想要的成果,不仅能兑现之前的承诺,还能带来更大幅度的提升。」

现在有三个团队在推进这个项目:Federighi 的 Siri 团队、John Giannandrea 的 AI 部门,还有 Eddy Cue 的服务团队。连 Vision Pro 负责人 Mike Rockwell 都被调来救火。

另外,苹果还准备完全重构 Siri,预计基于三个核心组件:规划器、搜索系统和总结器。与以往完全自研不同,这次苹果同样开始考虑引入第三方模型,项目代号叫 Glenwood。

目前的方案是用 Google 定制的 Gemini 模型来承担总结器任务,运行在苹果的私有云服务器上。苹果还在评估是否把规划器也交给 Gemini 或 Anthropic 的 Claude 模型。同时,苹果会保留自己的 Apple Foundation Models 来处理用户本地数据,保护隐私。

这里有个小插曲。据说 Anthropic 的 Claude 模型质量确实比 Gemini 更好,但开价太高——每年超过 15 亿美元,苹果最终选择了更便宜的 Google 方案。

按计划,新版 Siri 会在 iOS 26.4(内部代号 Luck E,最早明年 3 月发布)中上线。iOS 26 会随下周的 iPhone 17 一起预装发布,但不会有重大 AI 新功能。

除了 Siri 升级,苹果还在开发:

  • 新的 Siri 界面,明年上半年推出
  • 健康 AI 助手,为 2026 年的付费健康订阅服务做准备
  • 更强的对话能力,用于未来的家居设备

讲真,现在的 Siri 确实挺尴尬的。

2011 年刚发布时,大家都觉得这是革命性产品,结果十几年过去了,它反而成了苹果在 AI 领域落后的象征。

目前 Siri 能回答一些基础问题,比如人物介绍、天气预报、电影信息这些,但一遇到复杂问题就抓瞎,经常要依赖 Google 或 ChatGPT 的结果。

选择与 Google 合作的这个时间点也挺巧的。

美国法官刚裁定苹果可以继续和 Google 保持默认搜索合作关系,但苹果服务部门主管 Eddy Cue 之前在庭审中透露了个关键信息:来自苹果设备的 Google 搜索次数开始下降,这是 20 年来第一次。

言外之意是,AI 搜索正在威胁传统搜索引擎。

考虑到这一点,苹果此前还商讨过收购路线。Eddy Cue 和并购负责人 Adrian Perica 曾讨论过收购 Perplexity 和法国 AI初创公司 Mistral。然而,苹果今年夏天认真评估过 Perplexity 的技术,但最终放弃收购,选择推出自家产品。

而在今天,Mistral AI 也宣布完成新一轮融资,估值达到 140 亿美元。

更糟糕的是,苹果 AI 团队现在面临人才流失问题。

Foundation Models 团队创始人 Ruoming Pang 今年 7 月跳槽 Meta,拿了超过 2 亿美元的薪酬包,随后约 10 名团队成员跟着离职。
这种「跳槽潮」还在加速。上周甚至又有三位关键研究人员离开,两个加入 OpenAI,一个去了 Anthropic,预计还有更多成员正在观望,寻找新机会。

在这种内外交困的情况下,苹果这次 Siri 大升级确实显得格外迫切。

毕竟看着 ChatGPT、Google AI 这些后来者风生水起,自己的 Siri 还在原地踏步,也说不过去。新版搜索功能如果真能做到宣传的效果,对用户来说肯定是好事。

但关键问题是,苹果能不能真正把这次升级做好?毕竟技术要靠 Google 支持,人才还在不断流失,这样的条件下能做出多颠覆性的产品,还真不好说。

一切有待明年春天见分晓吧。

附上原报道地址:
https://www.bloomberg.com/news/articles/2025-09-03/apple-plans-ai-search-engine-for-siri-to-rival-openai-google-siri-talks-advance?srnd=homepage-americas

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Google Pixel 10 评测汇总:AI 用得爽,就是 AI 手机了吗?

作者 苏伟鸿
2025年8月29日 13:50

Google Pixel,在当今的市场中确实是一款非常独特的手机。

手上同时有顶级 AI 技术和操作系统,还在自研手机处理器的厂家,全球目前只有 Google 一家,Google Pixel 自然而然就成为了 AI 手机的一个范本。

去年的 Pixel 9 不管是在手机本身的产品力还是 AI 能力上,都做到了系列的新高峰,继任的 Pixel 10 作为十周年之作如何突破,不免让人期待。

外网的各大媒体和博主已经拿到了这款手机并进行了详细的评测。总的来说,Pixel 10 并不是一次飞跃式的大更新,而是 Pixel 9 基础上的一次迭代,是一台搭载了实用的 AI 功能的优良手机。

但它还不是「AI 手机」。

终于有实用的 AI 功能了

比起影像上整的花活,全新的「Magic Cue」功能要更加实用一点,The Verge 的评价非常到位:

真正让 AI 功能从派对小把戏变成移动设备上发挥作用的功能。

Magic Cue(魔法提示)有点像我们现在经常用到的「验证码自动提取」功能,范围和能力都要更强,会自动收集用户应用、电邮、短信、截图、日程等等的数据信息,然后在用户需要用到的时候主动提供。

比如当朋友问到今晚吃饭的地址,短信应用就会自动提示相关信息,用户一点就行。

以及更进阶的一种意图识别能力:在食评网站上看到几家餐厅推荐,打开 Google 地图搜索框键盘就会自动建议餐厅的名字。

不过媒体都发现,这个功能不总是非常稳定能生效,并且需要长时间使用手机,等待处理应用之中的所有信息,而一些比较久远的预订安排就很难被提示。

▲ Magic Cue 不总是有用,有时候也给不出任何提示,图源:Engadget

对比起效果类似,但需要用户主动去询问的苹果 AI Siri,Google 的 Magic Cue 在实用性上要更强,毕竟我们对 AI 的期待,还是它能更主动地将结果推送到我们面前,减少自己的存在感。

Pixel 10 还带来了类似三星「即时简报」的 AI 个人总结功能「Daily Hub」,快速摘要提示个人一天的日程安排,并推送一些你可能以为会感兴趣的内容。

▲ The Verge

由于 YouTube 也属于 Google 服务,有时候 Daily Hub 推荐的 YouTube 视频或音乐确实能很好预测到用户的喜好。

不过 The Verge 发现这个内容推送不总是很好用:仅仅是因为用户查了废品回收公司的时间表,手机就给她推送了一堆废品回收的相关知识。

AI 实时翻译可以说是 Google 的舒适区,这次 Pixel 10 更进一步,把这个功能集成在通话之中:跨语言直接聊天,AI 会按照你的声线,把你说的话翻译成对方的语言。

▲ 图源:9to5Google

看起来很理想,而在 The Wired 实测中,只能实时翻译一段时间,很快就连朋友的语音都听不见了,并且在语速很快的时候也无法正常运作。

这个功能更像是「秀肌肉」而不是从日常使用角度出发,毕竟大部分人很少有机会和外国人通电话,即使遇到这种场景,对方大概率也是陌生人,也没有太大必要还原自己的声线了。

这种乍一看很高技术力,实际上并没有太多作用的功能在 Pixel 10 上比比皆是。比如从发布到实测都被吐槽的「Camera Coach」——AI 实时分析取景器,生成一个个详细步骤帮你拍出好照片。

这个功能确实能拍出不错的照片,代价就是整个过程变得非常繁琐,需要用户进行不少尝试,而我们用 AI,不就是想跳过这些繁琐步骤,直接获得一个不错的结果吗?

Pro Res Zoom 新功能或许就是我们喜闻乐见的一种 AI:利用 Pixel 10 Pro 的 5 倍长焦拍摄一张 100 倍的照片,然后用 AI 对细节进行增强。

实测效果比预想中要优秀很多,虽然不能作用于人脸,出片质量还算稳定,不过由于照片细节要靠 AI 自己脑补重画,所以有时候出片会比较诡异,比较适合光线充足、拍摄对象很好预测的场景。

▲ 放大 100 倍拍摄,左:未开启 Pro Res Zoom;右:开启 Pro Res Zoom

「指令修图」也是一个相对更实用的场景:直接告诉 AI 你想把图修得怎么样,为图片增加或删除什么物体,AI 就会根据你的指令调整、重绘图片。

不少媒体都对这个功能给出了好评,让不懂色阶、曲线等等参数的小白几秒内 P 出好照片,当然也有短板,比如没办法拉直一些倾斜的拍摄物体,也很难针对单一的拍摄对象进行精修。

关于这个功能,Wired 有一个很有趣的观点:很好体现了 Pixel 10 的「AI 手机」属性,让用户知道自己手上的手机,还能用自然语言完成一些复杂交互。

▲ 两个单词让 Gemini 为我修出美图,图源:Android Central

总体来说,外媒认为 Pixel 10 这台「AI 手机」上的 AI 功能虽然又多又杂,但其中有不少实用性很高,另外一些则显得有点强行。

当然,Pixel 10 的 AI 功能也免不了幻觉和误解用户意图的毛病。The Verge 的编辑在用全新的「日记」应用时,写道自己的女儿心情不好,因为今天是她朋友在学校的最后一天,AI 马上安慰这位编辑节哀顺变,其实这位好友只是要转学了。

AI 之外也是好手机

AI 之外,外界对 Pixel 10 最关心的,还有全新的 Tensor G5 处理器实际表现如何。

Google 自研的 Tensor 处理器由于此前采用的是制程落后的三星工艺,导致连续四代都被诟病性能差、能耗高,G5 换用苹果同款的台积电 3nm 工艺,因此期望值还是很高的。

虽然从跑分上看,G5 还是落后高通和苹果一代,但体验上纵向对比以往的 Pixel 9 手机,还是有不小的提升的。

最明显的感知:Pixel 日常使用终于不会无缘无故发热,甚至还能打游戏了。

Android Central 用 Pixel 10 Pro 启动了《原神》和《我的世界》,能够以 60FPS 的帧率运行,而上一代 Pixel 9 Pro 连 40FPS 都相当吃力。

▲ 图源:Android Central

The Wired 则尝试了更极限的场景。最高设置跑一个多小时《鸣潮》,Pixel 10 Pro 会出现一些卡顿,没有均热板配置的 Pixel 10 会更卡并且更烫,总体体验都很好,只是依旧不如 iPhone 16 Pro 或者三星 Galaxy S25 Ultra。

而 Android Authority 发现,G5 的 GPU 更换了架构,带来了一些潜在的兼容性问题,以及比前一代更明显的发热问题,导致长时间使用后,Pixel 10 系列的 GPU 性能表现已经很接近上一代了。

▲ 图源:Android Authority

比起性能跑分,Google 更注重的其实还是 Tensor 跑本地 AI 大模型的能力。

台积电代工的 Tensor G5 另一大优势就是更优秀的能耗表现,即使三款手机的电池容量提升不大,手机续航还是有不小的提升。

不管是 Pixel 10、Pixel 10 Pro 还是 Pixel 10 Pro XL 都属于是「妥妥用一天」的水平,特别是 XL,续航时间比前代提升足足 90 分钟,能亮屏 7 小时左右。

虽然充电功率没有太大提升, Pixel 10 系列全新的 Qi2 无线磁吸充电依旧获得了不少好评,但有一个降级:不再支持过往型号的反向充电功能,不能再帮其他设备进行无线充电了。

▲ 图源:The Wired

影像方面虽然硬件上改变不大,不过 Google 的长处还是调校和算法。

Pixel 10 上的人像模式获得了一致好评,支持全分辨率的人像拍摄,可以捕捉更高层次的细节。

▲ 图源:CNET

但 Engadget 发现这为手机带来更大的处理压力,连拍三张手机就会需要暂停拍摄进行处理。

成片方面,Pixel 10 的人物肤色比较均衡,并且对头发进行了单独优化,The Verge 形容「保留了每一缕头发」,弱光环境中 Pixel 10 Pro 表现远远优于 iPhone 16 Pro。

▲ 图源:PetaPixel

▲ 左:iPhone 16 Pro Max,右:Pixel 10 Pro,图源:The Wired

同样可圈可点的还有 Pixel 10 Pro 的 4800 万像素的五倍长焦,不仅色调准确,在任何光照环境下都能实现清晰、干净的成片效果,The Wired 给出了高度评价:

这些手机(Pixel 10)的变焦功能真是一种享受。

▲Pixel 10 Pro 5 倍光学变焦,图源:CNET

AI 手机的下一步怎么走

Pixel 10 是一台好手机吗?几乎每家媒体都给出了一个 8 分以上的好评,从这个层面上来说这确实是一款不错的产品。

并且很难得的,在 Pixel 10 配备的一大箩筐 AI 功能之中,确实是有实用的,当然也有「为 AI 而 AI」的整活。

只是,即使是手握顶级 AI 模型、操作系统以及处理器的 Google,做出来的「AI 手机」也只能给人一种「就这」的感觉,不免让人觉得有点灰心。

▲ 通话时也能提供航班信息的 Magic Cue,图源:9to5Google

虽然「Magic Cue」和指令修图确实好用,它们解决的更多是用户的痒点,把一些平时不够好的体验更流畅了,谈不上「颠覆性」,本质只是 AI 对当下手机使用的一种赋能,而没有改变我们用手机的方式。

本质上,这些功能和「自动填验证码」的创新,其实没什么不同。

在我们的想象中,AI 的运行逻辑应该是由人类用户下达指令、AI 自动理解指令并主动结合周围的一切资源开始自动执行任务:

我不需要谷歌相册必须要我点击编辑按钮之后才会弹出 Gemini 对话框,我需要直接唤醒 Gemini:帮我把我刚才拍的两百张酒吧照片里面模糊的删掉,P 一下亮度和颜色,然后选出 9 张不一样的鸡尾酒发朋友圈。

而且,即使 Pixel 10 的性能已经有明显提升,不少 AI 能力实现端侧运行,能力依旧相对有限,还是有相当一部分的功能需要联网,利用云端 AI 算力进行。

而云端就意味着这些功能不是随时就绪,体验的好坏非常取决于网络连接的速率,也很大程度制约了一些更强大的功能落地到手机场景。

平时用电脑进行办公学习,调用云端强大的 AI 聊天机器人协助我们很正常,而在智能手机,日后甚至还有眼镜这些碎片化强移动的场景中,云端 AI 并不是一个最完美的方案。

Pixel 10 搭载的端侧 Gemini Nano 小模型完整的规模也在 8B 左右,虽然已经不算小,对比动辄 70B 上下的常规生成式模型来说,这中间有难以逾越的鸿沟。

在这几年内,我们也难看到手机的性能表现突破到这种水平,完全成为一台内置强大大模型,交互上完全不同的 AI 手机。

所以,Google Pixel 10 是一台「搭载了不错 AI 功能的好手机」,但它距离我们预期之中的「AI 手机」,还有不小的距离。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


神秘「香蕉」AI 正式上线!Google P 图新王深夜炸场|附体验方式

作者 张子豪
2025年8月27日 12:44

还记得之前大家热议的神秘 AI 图片编辑模型「nano-banana」吗?

前几天,我们在 LMArena 大语言模型竞技场里面用它进行了多轮测试,结果表现都非常出色。

现在,Google 终于揭开了它的神秘面纱。

▲ Google AI Studio 负责人 Logan Kilpatrick 发推文宣布正式推出 Gemini 2.5 Flash Image 模型

Google 正式推出了其最先进的图像生成与编辑模型——Gemini 2.5 Flash Image。

▲ 在多个榜单上都是第一名,尤其是 LMArena 榜单几乎是遥遥领先

在更新的技术博客里面,Google 提到此前的 Gemini 2.0 Flash 已经在图像生成方面,以其低延迟和高性价比受到了开发者的喜爱,但用户们也一直期待更高质量的图像和更强大的创作控制功能

Gemini 2.5 Flash Image 就是带着一系列的重磅更新,来强势回应这些期待。

和我们之前的体验效果一样,Gemini 2.5 Flash Image 的主要特点包括下面几点

  1. 充分保持角色的一致性
  2. 基于提示的图片编辑
  3. 利用 Gemini 的现实世界知识
  4. 多幅图像融合

一张图讲一个故事:角色、场景随心换

以往的 AI 绘图工具,最大的痛点之一就是难以保持角色或物体的一致性。我们都曾经经历过,想让同一个角色出现在不同场景中,结果却常常画风突变,每一次生成都像换了个人。

Gemini 2.5 Flash Image 彻底解决了这个问题。

▲ 图片来源 X@geminiap

它可以轻松地将同一个角色置于不同的环境中,或者从多个角度展示同一款产品,同时完美地保持其核心主体不变。Google 提到这对于需要讲述连续故事、生成品牌系列资产或制作产品目录的场景来说,无疑是一项革命性的功能。

为了展示这项能力,Google AI Studio 中还提供了一个模板应用,让开发者可以快速上手,甚至在其基础上进行二次开发。

▲ 体验地址:https://aistudio.google.com/apps/bundled/past_forward

在这个体验项目里,我们不需要输入任何的提示词,只用上传一张人像照片,它就会调用这个最新的图像模型,为我们生成从 1976 年 到 1990 年等各个年份的照片。

马斯克看到自己这么帅心里一定在想,我的 Grok 也可以。

一句话修图,用自然语言精准编辑

除了这种保持好高度一致的角色生成,精准的编辑也是一大亮点。Gemini 2.5 Flash Image 允许我们通过简单的自然语言指令,对图片进行精准的局部修改 。

像是模糊图片背景、消除 T 恤上的污渍、从合照中移除某个人、改变人物的姿势、为黑白照片上色……

这一切,都不再需要复杂繁琐的专业软件操作,我们只需要像聊天一样,用一句话告诉 AI 想做什么即可。

这跟我们之前在 LMArena 中的体验是一样的,像是我们也转换过照片的风格,从黑白到彩色;以及对照片进行细微的调整等。

▲ 图片来源 X@geminiapp

Google 同样设计了一个简单的应用,来方便我们更好的体验这种基于提示词的图像编辑,但是完全媲美 PS 软件的效果。

▲ 体验地址:https://aistudio.google.com/apps/bundled/pixshop

不止会画,更「懂」世界

过去的图像模型虽然能创造出精美的图片,但往往缺乏对现实世界的深层语义理解 。

Gemini 2.5 Flash Image 借助 Gemini 强大的世界知识库,让图像生成变得更加「智能」。

这意味着,模型不仅能看懂我们潦草手绘的图表,还能回答与现实世界相关的问题,并一步到位地执行复杂的编辑指令。

▲ 体验地址:https://aistudio.google.com/apps/bundled/codrawing

听起来很有多模态推理的感觉,Google 在 AI Studio 中展示了一个互动教育应用,将一块简单的画布变成了可以答疑解惑的智能导师,我由衷的感叹这个模型是真的厉害。

图像融合:轻松实现「无缝」拼贴

新模型还带来了一项酷炫的功能——多图像融合。我们可以将一张图片中的物体「放」进另一张图片的场景里,或者用一张图的风格去渲染另一间屋子,整个过程只需一条提示指令就能完成。

同样是 Google AI Studio 里面的模板体验应用,我们只需要把产品拖拽到新场景中,就可快速生成一张毫无违和感的、真实照片般的融合图像。

▲ 体验地址:https://aistudio.google.com/apps/bundled/home_canvas

在这个模板应用里面,我们甚至不需要输入任何提示词,可以直接拖动某个物体,到场景图片上的具体位置,然后它会自动生成融合的图片。

如何上手体验?

除了我们在前面提到的那些 Google AI Studio 里面的模板应用。

目前,Gemini 2.5 Flash Image 已经可以通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 进行访问。

关于调用 API,具体的定价是每百万输出 token 30 美元,官方介绍,生成一张图片大约消耗 1290 个输出 token,也就是说,每张图片的成本约为 0.039 美元,换算下来人民币不到 3 毛钱

值得一提的是,所有通过 Gemini 2.5 Flash Image 创建或编辑的图片,都会包含 SynthID 隐形数字水印,以便识别其为 AI 生成或编辑的内容。

这跟前些天 Google 发布 Pixel 10 系列手机时,讲到 AI 图片编辑 Ask Photo 工具时,使用的 C2PA(内容来源和真实性联盟) 内容凭证是一样的。

最后,Google 还提到正在努力提升模型在长文本渲染、角色一致性稳定度和图像细节真实性等方面的表现。

总而言之,Gemini 2.5 Flash Image 的发布,让 AI 图像工具从一个单纯的绘画玩具,向一个真正实用的创意与生产力工具迈出了一大步。

它不仅解决了我们过去使用 AI 绘图时的诸多痛点,还带来了更多有趣、实用的新玩法。

之前 4o 生图能力出来,看到很多 App 开始主打用一张图每天生成一首诗,还有像是拿到了今年 Apple 设计大奖的 CapWords,拍一张生活里的照片,来实景学习一门新的语言……

我现在已经迫不及待想看到基于 Gemini 2.5 Flash Image 模型,又会有哪些新应用诞生了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


谷歌的 Pixel X,和我们想的不太一样|Made by Google 2025 发布会速览

作者 马扶摇
2025年8月25日 14:16

在经过长足的预热,并且见识到谷歌堪比阿伯维尔的保密程度之后,我们终于迎来了 2025 年谷歌的 Pixel 系列新品。

不出所料,其中大部分硬件参数都与前期爆料中的信息相符,大小两款 Pro 机型更是与上一代别无二致,通过「不换壳只换芯」的方式实现了一次多快好省的升级换代。

图|Business Wire

不过本次 Made by Google 发布会也并非全无亮点——虽然今年四款 Pixel 手机的硬件毫无惊喜,但 Gemini 又迎来了一波新的加强,与手机的软硬结合程度也更上一层楼。

但 AI 的加强不代表可以在硬件方面摆烂。今年的 Made by Google 上,除了 Jimmy Felon 的串场主持之外,我们还看到了四台比曾经任何一代都要偏科的 Pixel 10 系列新机。

太长不读(TL;DR)

  • Pixel 10:799 美元起,小底 5 倍长焦,USB 速率升级,影像提升全靠算法
  • Pixel 10 Pro / Pro XL:999 美元 / 1199 美元起,传感器看齐 9a,XL 独占 25W 无线充电
  • Pixel 10 Pro Fold:1799 美元起,全世界第一台 6 级防尘折叠屏,其余配置都是熟悉的面孔
  • Pixel Watch 4:349.99 美元起,市场上少数几家坚持曲面圆形屏幕的智能手表
  • 购买 Pro 或者 Fold 机型,赠送一整年(239 美元)的 Google AI Pro 订阅

一碗水端平的升级

谷歌作为目前市面上为数不多的几家拥有自研 SoC 的厂商,从 Pixel 6 系列就实装的 Tensor 处理器却饱受性能不足和能耗不优的问题。

图|Google

这个历史性难题终于在今年得到了解决——原因很简单,谷歌终于结束了找三星做 5nm 代工的日子,转头用上了台积电的第二代 3nm(N3E)制程,来定做本次的 Tensor G5 处理器。

根据发布会上公布的信息,Tensor G5 处理器采用了 1+5+2 的八核心架构,超大核采用 ARM 的 Cortex X4 核心,综合性能结合发布会前泄露的安兔兔数据,G5 相比 G4 提升明显,与骁龙 8 Gen 2(约 128 万分)比较相近。

图|TechNetBook

而谷歌本次也保持了全系列处理器共享的优秀传统,今年的四款 Pixel 新机全都可以用上 Tensor G5,更难得的是甚至没有像隔壁苹果那样,在核心数上阉割。

此外,在 iPhone 玩上磁吸充电足足五年后,另外几家大厂终于跟进了机身内置磁吸的功能,Pixel 10 全系列都支持名为 Pixelsnap 的磁吸生态。不仅有完整的 Qi2 协议,还包括谷歌自家的配件生态:

图|YouTube @MrMobile

然而 Tensor G5 终于(勉强)赶上时代,Pixel 10 系列的网络配置却迎来了一波大变——

根据发布会描述,今年的美版机型中,除了折叠屏 Pixel 10 Pro Fold 之外的三台直板机全部取消了实体 SIM 卡槽,对于国内仅剩的那些喜欢收美版无锁【洋垃圾】的 Pixel 玩家们是一个噩耗。

美国区域 Pixel 10 商店页面,显示仅支持双 eSIM|Google

直板机:Pixel 的十年

作为整整第十代的谷歌自有品牌,去年的发布会之后,我们原本还在期待 Pixel 10 会像 iPhone X 那样在这个有意义的节点上做出一些大改,但可惜谷歌还是突破了我们的期待——

Pixel 10 系列的三台直板机,在外观方面几乎与前代「没有任何差别」:没有特殊的边框材质、没有用上抗反射玻璃、没有花里胡哨的后盖,依然是我们熟悉的 Pixel 模样。

图|Google

更好笑的是,谷歌今年在 Pixel 上主打一手「有得必有舍」,在一些以往对于 Pixel 手机至关重要的方面倒吸一口牙膏。

就拿 799 美元起的 Pixel 10 无印来说,在延续了四代双摄之后,终于在今年看齐三星的 S 系列,变成了主长广三摄,新增一颗 5 倍的长焦,传感器为三星 3J1,面积 1/3 英寸:

图|Google

然而在加上长焦的同时,Pixel 10 的主摄和超广角传感器却被迫缩水,换成了与中端机 Pixel 9a 相同的传感器,对于曾经标榜「不搞传感器划分阶级」的 Pixel 来说,称得上是一种背叛。

相机之外,Pixel 10 也迎来了一项更有意义的升级,作为中杯机型,它的 USB 接口速率升级到了与 Pro 机型一致的 USB 3.2 ,相比取消实体 SIM 卡槽看上去非常像是大棒之后的那颗蜜枣。

图|YouTube @9to5Google

Pixel 10 至少还有些变化,但是今年的两款 Pro 机型却几乎没有什么硬件升级——尤其是在影像方面,在这个连三星都在试着把 2 亿像素塞进折叠屏的时代显得格格不入。

但有趣的是,谷歌在今年重新捡起了一个尘封许久的名字:Super Res Zoom。这项最早在 Pixel 3 上落地的算法望远增强功能在 Pixel 10 Pro 系列上迎来了一个新的高度,倍率来到了足足 100 倍:

发布会上展示的 100x 样张,AI 绘画痕迹明显|YouTube @Made by Google

然而结合 Pixel 10 Pro 上那颗原本就算是小底的长焦传感器,最后的成片油画效果可想而知,基本上也就只能骗骗水深火热的外国用户了。

但 Pixel 10 Pro 系列并非没有好消息,更具体地说,是专属于 Pixel 10 Pro XL 的 moment:相比其他两款机型的 Qi2 ,最大号的 Pixel 10 Pro XL 独占了 Qi2.2 协议,无线充电功率最高可以达到 25W——

图|YouTube @9to5Google

折叠屏:这台 Fold 不吃土

而在折叠屏方面,谷歌的步伐依然不急不缓,Pixel 10 Pro Fold 第一眼看上去和 Pixel 9 Pro Fold 完全一样:

图|Google

但这并不意味着 Pixel 10 Pro Fold 完全没有创新,谷歌一如既往的在别家厂商相互卷的时候选择了一条截然不同的道路——事实上,Pixel 10 Pro Fold 是全世界第一台支持 IP68 级防水防尘的折叠屏手机:

图|Google

在此之前,折叠屏的三防记录是荣耀 Magic V5 的 IP58/IP59 双认证,防水等级几乎已经达到了标准的极限,然而在生活中更常见的防尘场景下,Pixel 10 Pro Fold 却是第一台做到 6 级防尘的折叠屏。

根据谷歌的介绍,Pixel 10 Pro Fold 采用了一套全新的「无齿轮」式铰链,完全依靠凸轮结构营造折叠手感,谷歌声称这套铰链系统可以支撑超过十年的使用——比 Android 的支持周期还长三年。

但谷歌像是要强行把水端平一样,Pixel 10 Pro Fold 的防护等级得到了提升,影像方面却被砍了一刀,它的主摄传感器在分辨率和面积上全都迎来了缩水,Gemini 肩上的担子又重了一些。

图|Google

Gemini:反了反了,AI 反噬手机的卖点了

不出所料的,本次 Made by Google 硬件发布会上,还是有差不多一半的时间留给了 Gemini 。

其中最有用的,是更新后的 Gemini Live。它在原本只能语音对话的基础上,增加了通过手机摄像头识别并主动框选关键信息的能力:

图|Google

相比单纯的语音交流,这种带有视觉提示的交互方法显然更加未来化,与我们在游戏中看到的那种可交互 HUD 的概念和效果更为接近。

此外,今年的 Pixel 相机还加入了基于 Gemini 的拍摄辅助,AI 不仅会指导你的构图,甚至还会从前期的移动画面中截取出几种具有代表性的姿势供用户选择,先选择风格、再提供一步一步的构图指引:

图|Google

而 Gemini 同样加入了 Google Photos 的后期流程,现在用户可以通过类似与 AI 聊天要求文生图的方式,用自然语言指导 Gemini 做照片后期,包括消除眩光、去雾、增加饱和度等等。

图|Google

更好玩的是,苹果去年在 WWDC 上画的 AI 大饼,竟然被谷歌给填上了。

本次发布会上,谷歌介绍了一款名为 Magic Cue 的功能,实现方式类似 iPhone 的 App Intents 与智能建议的结合,会在合适的软件场景里,自动弹出根据你的数据历史、日程和时间轴提取的信息,能够「帮你记住东西」:

比如在和航司沟通改签的时候自动展示你订错的信息|Google

此外 Gemini 的语音能力也得到了提升。在发布会的后半段,Jimmy Felon 串场,展示了 Gemini 在电话通话中的实时翻译功能——并非简单的文本翻译、机械音朗读,而是由 Gemini 自动识别和模拟讲话人的音色和语气,讲出一段「比你更像你自己」的外语:

图|YouTube @Made by Google

这或许是我们在本次发布会上看到的最具科幻感的功能,因为 Gemini 的拟声翻译无论是速度还是准确性,在现场展示中都达到了非常可用的水平,距离实现「代替人类生活」也更近了一点。

一边升级一边降级的 Pixel 10、纹丝不动的 Pixel 10 Pro、防水又防尘的 Pixel 10 Pro Fold,价格涵盖 799 美元(约合 5733 人民币)到 1499 美元(约合 10756 人民币),如果你生活在一个「两超一强」垄断手机市场,你会对 Pixel 感兴趣吗?

图|Google

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


零一开源|前沿技术周刊 #12

作者 kymjs张涛
2025年8月20日 09:22

前沿技术周刊 是一份专注于技术生态的周刊,每周更新。本周刊深入挖掘高质量技术内容,为开发者提供持续的知识更新与技术洞察。

订阅渠道:【零一开源】、 【掘金】、 【RSS


大厂在做什么

美团智能头盔作为专为外卖骑手打造的智能安全装备,具备蓝牙通话、戴盔识别、智能语音助手、碰撞摔倒监控等功能,核心软件功能围绕如何通过主动安全和被动安全相结合的方式有效保护骑手。 本期分享主要介绍智能头盔骑行通话质量、智能语音助手、碰撞摔倒监控三项软件能力。其中“骑行通话质量和智能语音助手”降低骑手操作手机导致的“分心”,帮助骑手“防患于未然”。“碰撞摔倒监控”最大限度的保护骑手、快速的感知事故和触发救治。
在数字内容井喷的时代,移动端已成为视频创作的重要阵地,而视频编辑页作为创作工具的核心场景,不仅为创作者提供了丰富的表达手段和创意平台,更是提升视频制作的效率。通过直观的操作界面和丰富的功能集成,用户可以轻松地将素材、音频、特效及文字等进行融合,创造出独具风格、彰显个性的作品。
如今,AI 编程工具正在重塑软件开发,其核心目标直指“开发民主化”。它们不再仅仅是补全代码片段的助手,而是能理解自然语言需求、生成可运行代码框架、甚至参与系统设计的“协作者”。这一背景下,越来越多的企业开始对外发布相关产品,美团便是其中之一。
兄弟们,刚点开这篇《2025 Google 开发者大会主旨演讲精华汇总》,结果微信提示“环境异常”,得验证才能看… 估计是链接被拦截了?暂时没法扒拉具体内容,等能进去了再瞅瞅。不过按往年套路,大概率是AI开发工具更新、云原生新特性、Android/iOS跨端方案这些硬货,可能还有TensorFlow或Flutter的新版本?回头内容正常了再补个详细的,现在只能说——等我验证完再给你们同步干货!
高德终端技术团队进行开源项目仓库代码升级期间,由于主版本跨度大,代码量更新变化也很大,过往在低版本上的经验知识不足以支持升级,如果依赖个人读懂整体仓库代码耗时过长。为研发提效,使用了阿里内部代码平台工具,发现暂不能满足一些定制化的知识问答,同时使用上也存在一些限制,外部类似deepwiki工具又存在代码安全问题,因此,基于code RAG和code Agent技术开发了研发提效工具,一定程度上满足了对仓库代码的定制理解,查询和修改需求。
从最初仅支持面向编译时的小程序端解决方案,到如今拥有支持多种前端框架和 UI 库的强大能力;从单一的构建工具,到通过开放生态为开发者提供 Webpack、Vite、ESBuild 等丰富的工具选择,让团队能够定制专属的研发流程;从专注小程序开发,到覆盖各大小程序平台以及 Web、iOS、Android、HarmonyOS 等移动端场景——Taro 的每一步成长都离不开社区的力量。
最近,我们上线了一个新能力:支持将部分中文视频翻译为外语的原声风格配音。也就是说,观众现在可以听到“这个人用另一种语言在说话”,但他的声音、语气、节奏,甚至个性表达都和原片几乎一致,不再是那种传统配音里千篇一律的“代言人声线”,而是像本人亲自讲外语一样自然。这背后,其实是一整套跨模态、多语言协同生成系统的能力升级。
在现代播放器架构中,音频后处理已不仅是锦上添花的功能,而是构建差异化听觉体验的关键组件。尤其在多样化的播放场景(手机外放、耳机、电视音响等)下,通过定制化的音效增强手段,有效提升听感表现已成为基础能力之一。

码圈新闻

这两天在上海世博展览馆举行的 2025 世界人工智能大会(WAIC)热度相当高,上到央媒下到朋友圈不断看到,甚至总理李强、双奖(诺贝尔/图灵)得主辛顿都在开幕式出现,影响力爆表。 周末去逛了一天,AI 的落地场景之多令人咋舌,看完以后我给之前的好几个点子都划上了删除线。还是得多出来看看大厂/新秀公司都在做什么,避免做类似的事情。 这篇文章按照类别记录一下印象比较深刻的产品。
刚刷完2025 Google开发者大会的客户端内容,给咱3年+的老哥们捋捋重点。 Android 15是重头戏:后台任务管理收紧了,得注意`WorkManager`新的电量阈值限制,不然应用可能被系统强杀;UI渲染加了硬件加速新接口,复杂列表滑动能再提10-15帧,对电商、社交类应用挺香。 开发工具方面,Android Studio Hedgehog直接集成了AI代码诊断,写`Compose`时会自动提示重组优化点,试了下比之前手动查省事儿多了。Flutter 4.0也放了大招,原生代码互调延迟降了40%,混编项目终于不用再纠结性能损耗了。 哦对了,跨平台布局`Jetpack Multiwindow`支持更完善了,平板/折叠屏适配能少写一半适配代码。暂时就这些干货,后台优化和Flutter新特性建议优先上手,其他的可以先放收藏夹吃灰~
今日,亚马逊云科技首次上线 OpenAI 开放权重模型,向数百万亚马逊云科技客户开放。客户现可通过 Amazon Bedrock 和 Amazon SageMaker AI 使用 OpenAI 开放权重模型,实现将先进的开放权重模型与全球最广泛云服务的深度集成。
世界机器人大会已经走过10年,回看以前的新闻和产品,此刻站在场馆里大概只有一个感慨:机器人发展太迅速了!
北京时间8月8日凌晨1时,OpenAI举行了长达1个多小时的线上发布会,正式推出了GPT-5。与此前的模型更新直播时间短且主要由研发人员发布相比,GPT-5的发布明显规格更高,不仅发布时间长、细节多,而且OpenAI首席执行官山姆·奥特曼也现身发布会现场。

深度技术

这篇文章我瞅着是讲Android底层的,主要扒了ART虚拟机加载Dex的整个流程,从Dex文件解析到内存映射、类加载这些关键步骤都拆得挺细。重点是结合脱壳场景,分析了加载过程里哪些节点能当通用脱壳点——比如某个钩子函数的调用时机、内存中Dex原始数据的暴露时刻。对咱们这种搞Android逆向或底层开发的来说,理清ART Dex加载逻辑,找脱壳点就有章法了,实操性挺强,值得细品。
在AI技术迅猛发展的今天,如何与大型语言模型高效“对话”已成为释放其潜力的关键。本文深入探讨了提示词工程(Prompt Engineering)这一新兴领域,系统解析了从基础概念到高级技巧的完整知识体系,并结合“淘宝XX业务数科Agent”和科研论文深度学习两大实战案例,揭示了高质量提示词如何将AI从“工具”升级为“智能协作者”。无论你是初学者还是实践者,都能从中掌握让AI真正为你所用的核心方法论。
Cursor 是近来大火的 coding agent 工具,凭借其深度集成的智能代码生成、上下文感知和对话式编程体验,极大地提升了开发效率,成为众多工程师日常开发的得力帮手。作为 Cursor 的付费用户,我已将其作为主力编码工具,每天在实际项目中频繁使用。只有真正深入使用,才能切身感受到它所带来的编程体验的神奇之处。在这个过程中,我也对其背后的技术实现产生了浓厚兴趣,本文试图通过一系列实验,深入分析 Cursor 在后台与大模型之间的通信机制,探寻 Cursor 智能能力背后的底层思想与设计原理。
多模态大语言模型(Multimodal Large Language Model)是指能够处理和融合多种不同类型数据(如文本、图像、音频、视频等)的大型人工智能模型。此类模型通常基于深度学习技术,能够理解和生成多种模态的数据,从而在各种复杂的应用场景中表现出强大的能力。
在构建RAG(检索增强生成)系统时,文本分块质量直接影响知识检索精度与LLM输出效果。本文将深入解析五种分块策略的工程实现与优化方案。文中还会放一些技术文档,方便大家更好的理解RAG中常见的技术点。

新技术介绍

迄今为止最大的Compose更新带来了原生自动填充, 智能动画以及让构建Android用户界面如同魔法般轻松的功能
兄弟,你发的这篇Flutter 3.35更新的文章内容好像有点小状况啊——页面显示“环境异常”,得先验证才能看具体内容。我这刷了半天,也没瞅见更新了啥新特性、优化了哪些性能。要不你先去把验证搞定,把正经的更新内容放出来?等内容齐了,我再帮你扒拉扒拉这版3.35到底香不香~
TheRouter 是由货拉拉技术开源的,可同时用于 Android/iOS/HarmonyOS 模块化开发的一整套解决方案框架。Android 支持 KSP、支持 AGP8,iOS 支持 OC/Swift,不仅能对常规的模块依赖解耦、页面跳转,同时提供了模块化过程中常见问题的解决办法。例如:完美解决了模块化开发后由于组件内无法获取 Application 生命周期与业务流程,造成每次初始化与关联依赖调用都需要跨模块修改代码的问题,是目前业界最领先的移动端路由框架。
随着AI时代的到来,各类AI工具层出不穷,业界都在探索一套完整的AI加成的提效方案,我们团队基于自身特色,利用起团队沉淀好的历史知识库,落地了一套深度结合AI的工作流,用AI武装研发团队,实现研发效率的提升。

博客推荐

兄弟,你给的这篇文章内容好像有点问题啊。标题写着《适配 16KB 页面大小:提升应用性能并为用户提供更流畅的应用体验》,但正文全是微信环境异常的提示,什么“完成验证后继续访问”“小程序赞”“在看”之类的,根本瞅不见正经内容。这样我没法帮你总结摘要啊,估计是复制的时候出岔子了?要不你检查下内容是不是漏了,或者重新发下正文?等你弄好我再帮你扒拉扒拉~
兄弟们,刚瞅了眼你发的《深入浅出Android的Context机制》,内容咋全是微信验证、点赞那些玩意儿?正文好像没显示出来啊。不过Context这东西咱老安卓开发肯定熟,简单说就是个“万能管家”——访问资源、启动Activity/Fragment、调系统服务(比如LayoutInflater、NotificationManager)都得靠它。最容易踩坑的就是Context的生命周期:Application Context全局单例,跟着应用走;Activity Context跟页面生命周期绑定,用完就没。要是拿Activity Context搞个静态单例,页面关了还被占着,内存泄漏妥妥的。平时记着:长生命周期的对象(比如单例、Handler)别用Activity Context,能用Application Context就用,准没错。等你文章内容正常了再细扒,先记住这几点避坑~
一般来说ArkWeb作为鸿蒙的Web容器,性能是够用的。但是针对网页的前置处理条件较多,例如涉及到DNS,大量的资源下载,网页和动画渲染等。作为重度依赖资源链的容器,当某个资源还没ok,就会很容易出现白屏,卡端,长时间loading这些影响用户体验的问题。

GitHub 一周推荐

阿里开源最新文生图模型

关于我们

零一开源】 是一个 文章开源项目 的分享站,有写博客开源项目的也欢迎来提供投递。 每周会搜集、整理当前的新技术、新文章,欢迎大家订阅。

[奸笑]

❌
❌