普通视图

发现新文章,点击刷新页面。
昨天 — 2026年1月7日首页

英伟达的个人超算,可能就是下一个消费级显卡

作者 张子豪
2026年1月7日 13:53

今年的 CES 黄仁勋主题演讲上,罕见的,他没有介绍英伟达的消费级显卡。

目前最新的消费级 GPU,还是去年在 CES 上正式发布的 RTX 50 系列。其中必然有内存全球大涨价的原因,当前市场的内存成本,一周之内就能涨价 50%-100%,并且多个分析机构表示,涨价会持续到 2027 年。

更多的原因还是 AI,就拿 AI 训练和部署来说。一块 RTX 5090 显卡的最大显存是 32GB,随便找一个表现不错的开源大模型,参数都是以百亿为单位,所需要的显存容量,32G 的优势会比较有限。

但英伟达显然不会放弃本地计算的市场,今年不发消费级的显卡,有了全新的消费级个人超算。

英伟达在 CES 2026 上展示了全新的 DGX Spark,并且用它完成了多个 AI 相关的任务。开发者和创作者不需要昂贵的数据中心,通过 DGX Spark,就可以在本地流畅运行、微调,甚至推理高达 100B 参数的前沿 AI 模型。

我们之前也分享过 DGX Spark 的上手体验,下载 1200 亿参数的 GPT-OSS 开源模型,或者部署 Qwen 图片生成、Wan 2.2 视频生成,DGX Spark 都能做到。

再回顾一下 DGX Spark 的主要情况。

  • 核心架构:基于 NVIDIA Grace Blackwell 架构打造,将数据中心级别的 AI 算力,浓缩到了紧凑的桌面机箱中。
  • 海量内存:单机配备 128GB 统一内存。更为独特的是,它支持通过 200Gbps 的 ConnectX-7 网络,将两台 DGX Spark 互连,组成拥有 256GB 内存的超级节点。
  • 核心能力:专为大模型时代设计,支持在本地运行 100B 参数级别的模型,或者对 70B 参数的 LLM 进行分布式微调。
  • 定位:它不仅是开发者的沙盒环境,而且还要做 AI 创作者的平台,主要是让高强度的 AI 工作负载,脱离云端依赖,在本地安全、低延迟地完成。

本次 CES 更新的最大亮点,在于通过软件升级引入了对 NVFP4 数据格式的全面支持。NVFP4 的数据格式,能够让新一代模型在保持智能表现的同时,内存占用降低约 40%,吞吐量大幅提升。

具体的实测数据,在两个 DGX Spark 配置上运行 Qwen-235B 模型时,使用 NVFP4 相比 FP8 性能提升最高可达 2.6 倍。这直接地解决了,过去使用 FP8 精度时双系统内存耗尽、无法多任务处理的难题。

硬件在桌面上,但访问方式可以很云端。CES 上展示的 Brev 更新,还解决了 DGX Spark 本地算力灵活性不足的问题。

现在,开发者可以通过 Brev,安全地远程连接 DGX Spark,就像使用云服务一样便捷。此外,Brev 支持智能路由层。用户可以将处理邮件或专有数据等敏感任务,强制保留在本地 DGX Spark 上运行,而将一般推理任务无缝路由至云端,兼顾了隐私安全与云端算力。

Brev 的引入,解决了本地算力不仅能用,还要好用的问题。它的本地计算支持预计于 2026 年春季正式推出。

这么强的算力能用来做什么,英伟达在 CES 现场的演示也给出了答案。

对于视频创作者,这是强大的创意生成加速器。将 AI 视频生成任务从笔记本转移到 DGX Spark 上,相比顶配 M4 Max 的 MacBook Pro,速度实现了高达 8 倍的提升,真正做到了让创作流不再卡顿。

不仅是个人开发者,对于注重本地安全的企业用户,DGX Spark 也能胜任。英伟达展示了由 Nsight 驱动的本地 CUDA 编码助手,企业开发者可以在享受 AI 辅助的同时,确保源代码完全存储在本地,杜绝信息泄露风险。

更有意思的演示是和机器人的结合。通过与 Hugging Face 的合作,DGX Spark 化身 Reachy Mini 机器人的「大脑」,让机器人具备了实时视听交互能力。现在看起来,用 DGX Spark 来做具身智能,也不再是大厂的专属。

Hugging Face 产品副总裁 Jeff Boudier 也提到,「开放模型赋予开发者以自己的方式构建 AI ,而 DGX Spark 将这种能力带到桌面端……让强大的 AI 变成真正可以互动的存在。」

为了降低开发者的门槛,英伟达还在 CES 上一口气新增了 6 个 Playbook(实战手册),重点覆盖了当下的热门需求。

  • Nemotron 3 Nano,英伟达最新的开源智能体大模型,用于本地 LLM 实验。
  • Live VLM WebUI,实时视觉语言模型分析,通过输入网络摄像头画面,直接在 DGX Spark 本地进行视频分析。
  • Isaac Sim / Lab,机器人仿真与强化学习。
  • 双系统微调,展示了如何利用两台 DGX Spark,分布式微调 70B 参数的 LLM。

除了 Playbook 的更新,DGX Spark 还预装了经过优化的 NVIDIA AI 软件和 CUDA-X 库。这意味着开发者无需在繁琐的驱动配置,和环境依赖上浪费时间,开箱即可获得「即插即用」的优化能力,直接开始构建或微调 AI 模型。

DGX Spark 在 CES 2026 上的出现,意味着「大模型本地化」已经不再是一句空话。无论是为了数据安全、开发效率,还是为了探索下一代具身智能,DGX Spark 都在努力成为下一代 AI 应用构建的基座。

就像现在,已经开始有让 AI 来玩游戏的项目了,未来需要的,可能除了一块能流畅打《黑神话:悟空》的 5090,还会有更多的桌面级 AI 超级计算机出现。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天以前首页

CES 2026 | 从「有龙则灵」到「万物有灵」,高通正在让 AI 成为体验背后的通用能力

作者 刘学文
2026年1月6日 18:04

智能手机、智能汽车、AI PC、智能眼镜、可穿戴设备,正在悄然改变人与信息的关系。信息不再需要被点开,而是自然地出现在视野和情境之中。技术不再是被调用的工具,而开始成为感知的一部分。为消费者身边的 AI 终端提供计算和连接能力,让 AI 延展到我们「身边」的每一个场景,背后常常有同一个名字「骁龙」。

 

前瞻今年 CES,眺望 AI 发展的「远方」,我们发现了属于高通跃龙的「有龙则灵」,从飞速迭代的人型机器人,到简单的安防摄像头,更复杂的无人机,亦或是智慧工厂里的物联网设备,越来越多的物相联、物生智。或许,「有龙则灵」将会发展成为「万物有灵」。而骁龙和跃龙之间的「联系」,与技术发展的规律实际上息息相关。在先驱们的影响下,AI 创新的涟漪和浪潮最终会波及所有人。

「转折」

如果说非要选取一个国人生活的代表性切片,那就应该是春晚和春节。

不出意外的话,不久之后的 2026 年春节联欢晚会上,我们会见到火山引擎作为合作伙伴亮相,以及更先进的机器人以更拟人更炫酷的动作跳舞。

春晚和春节的意义无需赘述,但千年传统也蕴含着静水深流的变化:上世纪 90 年代春晚的赞助商主要是海鸥手表以及中华自行车这样的品牌与产品,与当时「三转一响」(手表,自行车,缝纫机,收音机)这四大件家庭消费品形成呼应。

后来酒业和药业霸屏春晚,意味着我们的生活日益富足;接着在移动互联网时代,我们又见证了微信红包和支付宝、抖音和快手的竞逐。

《创新的扩散》这本书里有一张创新扩散曲线示意图传播甚广,在技术跨越了「远见者」和「实用主义者」之间的鸿沟之后,就离规模化的大众使用不远了。

AI 和具身智能机器人出现在春晚上,足以说明「转折」已至。春节并不是技术诞生的地方,却往往标志着技术完成「社会化」的关键节点:全国同步的注意力、家庭场景的集体使用、跨代际跨地域的共同体验,让一项原本属于先锋、尝鲜者小圈层的技术体验,被迅速地拉入到大众的日常生活里面去。

也是在这本书里,作者埃弗雷特·罗杰斯提出:创新的意义不在于它被发明,而在于它被采用。明白了这一点,就明白了大模型厂商和机器人企业成为春晚技术叙事关键品牌的意义。

「远方」

与春节时间上相差不多,但空间上隔着上万公里的 CES(消费电子展),蕴含着一些有趣的隐喻。

比如说相比于躺在保密实验室里的前沿创新技术,CES 因为离消费者仅仅一步之遥,这里发生的一切,可以看作是「创新在发明之后,以及大众层面采用之前」的中间状态,尤其是以芯片的发布最为符合这种状态。

可以说,去年下半年的高通骁龙峰会是骁龙平台的主场,骁龙芯片以「人」为圆心为消费者身边的AI终端提供计算和连接能力,覆盖智能手机、PC 和智能汽车,以及方兴未艾的智能耳机、智能手表/手环/戒指,乃至智能眼镜,而高通在 CES 上则以「另一条龙」为重心。

这条龙叫「高通跃龙(Qualcomm Dragonwing)」。

作为一家把使命定为「让智能计算无处不在」的公司,高通去年年初发布了「跃龙」品牌,这是因为高通的业务越来越多元,涉及的关键技术——AI、计算和连接,正与越来越多的行业深度融合,跃龙品牌就是给工业及嵌入式物联网、网络和蜂窝基础设施提供解决方案。

在其中暗藏着「个人AI」和「物理AI」的双线布局。一方面,让智能手机、AI PC、智能家居等产品,更流畅地运行,实现多任务并行处理,带来更沉浸式的娱乐、游戏、影像体验,这是人人都能感知到的「个人AI」。此外,让机器人、智能汽车能够更好地理解这个复杂的真实世界,同时对这个真实世界产生更无缝更丝滑的正面反馈和影响,让「物理AI」与我们在真实世界产生迷人的互动,帮助我们体验到更贴合我们偏好和需求的智能。

在 CES 2026 上,高通发布了跃龙 IQ10 处理器,这是跃龙家族里毫无疑问的旗舰处理器。当然,我们也可以说它是机器人处理器。

跃龙 IQ10 处理器与骁龙系列处理器有一些相似之处,比如都用到了 Oryon CPU,但 IQ10 处理器的核心数达到了 18 个,支持最多 20 路并行摄像头同时工作,专为高效VLA (视觉–语言–动作大模型)设计的NPU稀疏算力达到 700TOPS,具备专用图形着色器的 GPU支持并行预处理和后处理,还有为景深与定位设计的 CV(计算机视觉)处理器等模块形成一整套搭配,从这些不难发现IQ10主要为视觉感知以及后续的动作规划而设计。

广大手机品牌选择骁龙移动平台不仅仅是因为骁龙平台跑分高、性能棒、基带好、信号强,更是因为在骁龙平台上开发产品有非常丰富的技术特性以及开发工具支持。

类似的,跃龙 IQ10 处理器不仅仅是一个元器件,更是承载着高通面向可部署的机器人提供一整套核心能力的关键,以及面向机器人提供的从芯片到技能的统一架构之硬件基石,以高性能和高能效双重优势成为当之无愧的「机器人大脑」。

高通把跃龙 IQ10 及其下一代机器人全栈架构的使命定义为「将原型设计转化为可部署的智能机器」,也就是说,机器人,尤其是人形机器人有望从之前的发布会高光功能展示,到作为晚会演唱会的伴舞嘉宾展现真才实艺,发展到真正地进厂进店进公司打工实现「个人价值」。

相比于目前自动化工程已经大量存在的依靠固定程序工作的机器人(或机械臂),那些基于高性能机器人处理器、大量传感器和 VLA 大模型打造的新型机器人可以更灵活更自主地工作,比如独立完成货物分拣和货架补货这种需要移动、视觉感知、任务推理和动手能力的复杂任务。

更关键的是,在这个统一架构和一整套核心能力(复合 AI 系统,物理 AI 机器学习运维,AI 数据飞轮,异构边缘计算和可部署的开发平台)的帮助下,每个物理具身形态都可以成为持续学习的机器人。

所以,常常有人说高通发布的不仅仅是一两款处理器,而是一整套统一架构和核心能力。在物联网领域,高通也有类似的布局。

高通在 CES 2026 期间还发布了两款物联网处理器,并在过去 18 个月中完成了对 Augentix、Arduino、Edge Impulse、FocusAI 和 Foundries.io 的收购,这些硬件发布和收购整合让高通成为一家物联网整体解决方案提供商,为更多垂直行业提供更合适的全栈解法。

最终,这些解决方案还可以进入我们的家中,让家庭设备转变为智能设备。带来更加自然、更安全的体验。

提到有望在我们的家中实现「一户一台」的AI终端,机器人是可以期待的创新品类。机器人进入千家万户,是可以预见的未来,也是正在发生的事情,其中最普及的就是扫地机器人,扫地机器人刚出现的时候,没有对真实世界的理解能力,扫地全靠随机路线运行。

后来扫地机器人有了空间感知和建模,以及计算机视觉能力,等于有了「眼睛+脑子」,我们不妨以此为基础,再进一步想象它的变化,它可以长出「手」来,「腿脚」也更方便,「块头」变大,「力气」更强,这就是扫地机器人从草履虫进化到毛毛虫,再到早期智人的演进路线。

高通打造的面向机器人的复合 AI 系统与统一架构,以及跃龙 IQ10 处理器以及未来的更多创新,就是让这个「智人」阶段的机器人,往「现代人」乃至「超人」的方向发展。

在这个过程中,需要教给机器人知识(本地大模型和云端大模型),让它感知世界,理解世界并与世界交互,知道如何控制手脚(定位服务、计算机视觉、VLA 大模型与世界模型),这是一个机器人从肢体、五官五感到大脑的全面进化。

这是属于跃龙的「有龙则灵」,并且,不仅仅是机器人,搭载跃龙处理器的,还有万千种类万千形态的物联网产品,也许只是个简单的安防摄像头,或者是更复杂的无人机,亦或是智慧工厂里的物联网设备,最终,「有龙则灵」会成为「万物有灵」。

「身边」

汽车,或许是展开「身边」话题的最佳场所,是因为它的环绕感最强。也是在手机平板之外,骁龙出现得最多的地方。

▲ 零跑 D19 将搭载双骁龙 8797,采用 VLA 辅助驾驶系统

2025 年 12 月,恰好是零跑 10 周年,这家销量在新势力阵营里夺冠的企业,是高通骁龙汽车解决方案的亲密战友之一。

零跑 D19 是零跑在 SUV 市场里的旗舰产品,同时还是率先搭载双骁龙汽车平台至尊版(骁龙 8797)的量产车型。在双骁龙 8797 的支持下,零跑 D19 的中央域控制器将智能座舱、驾驶辅助、车身控制(灯光、温度、门窗)及车载网关等多个关键汽车功能域统一整合至单一高性能系统,这样能够降低开发的复杂性和成本,还可以为后续的能力迭代留出冗余。

这款车上的两颗骁龙 8797 则有着业内前列的能力,单颗芯片就同时支持 8 块显示屏(包含多块 3K/4K 高清屏幕),支持高达 13 路摄像头以及激光雷达、毫米波雷达、超声波雷达等多类型传感器,以及高精度惯性测量单元(IMU)。

汽车完全可以视为一台大型的 AI 设备,汽车的主流智能辅助驾驶方案背后的端到端大模型技术就是先进的 AI 技术,座舱系统里的 AI 应用场景也越来越常见。最简单的例子莫过于此前的语音交互是「指令式」的,而现在成熟的汽车语音交互都可以使用自然语言进行,因为座舱远比以往更聪明,从 AI 交互和 AI 应用出发,AI 智能体的雏形已然显现。

在AI PC领域,高通为骁龙X系列产品家族带来了新成员,骁龙 X2 Plus 是骁龙给 AI PC 领域最新也是最亲民的选择。虽然在 CPU 性能上,骁龙 X2 Plus 相比于骁龙 X2 Elite 和 骁龙 X2 Elite Extreme 有一些差距,但在 AI PC 核心的 NPU 性能上,X2 系列的芯片都保持了一致:达到 80TOPS 的 AI 运算能力。

与汽车的「环绕」不同,以眼镜、手表、戒指、吊坠、耳塞为形态的下一代智能穿戴设备,是「身边」的另一个维度,它离用户更近,也能做到更亲切,更无感。

如果非要在这么多的产品品类里选择一款产品作为 AI Native 产品,那么我的答案会是 AI 眼镜。

这是一类先天形态就非常固定,同时掣肘颇多的产品,同时也因为形态和掣肘而不得不选择 AI 作为核心能力。正如高通骁龙在手机和汽车领域绕不开的地位一样,骁龙 AR 系列芯片也是 众多AI 眼镜的标配。

以去年年中新发布的第一代骁龙 AR1+ 芯片为例,它的升级点主要有 4个方面:面积缩减 28%,方便眼镜的轻巧设计;功耗降低 7%,帮助持久待机和续航;同时支持 Llama 1B 这样的端侧小语言模型,具备一定的端侧 AI 能力;进一步提升影像能力,从而更好地支持多模态AI应用。

麦克卢汉说,媒介即信息,我们在非常多能通电的媒介形式里,都能看到高通的影子。可以说高通骁龙的芯片一定程度上塑造了媒介的形式,另一方面,媒介的形式也定义了骁龙芯片的发展方向。

智能眼镜、可穿戴设备、个人 AI 助手,正在悄然改变人与信息的关系。信息不再需要被点开,而是自然地出现在视野和情境之中。技术不再是被调用的工具,而开始成为感知的一部分。

这并不是第一次。机械钟表让时间变得可被管理,地图与 GPS 外包了空间判断,而今天的 AI 系统,正在辅助人类完成信息筛选与情境理解。

骁龙一直在身边,但身边的变化也一直在进行。

「联系」

从骁龙到跃龙,从春晚到 CES,从远方到身边,从手机电脑汽车耳机眼镜,到机器人物联网智能家居,这其中的跳跃性如此之大。

再看《创新的扩散》时,虽然这本书更多以传播学视角进行,但创新其实也具有「涟漪与浪潮」的二象性,不仅会越传越广,也会越传越高。

当特斯拉与小鹏都同时推出具有智能辅助驾驶的汽车与人形机器人,当理想以一家人工智能公司自居,并认为从 VLM 到 VLA 乃至世界模型是汽车与具身智能之间的必由之路时,AI 就是全向扩散的涟漪,也是越来越高的浪潮。

高通当然也知晓这一点,智能汽车与机器人之间的关系,在于有着通用的基础技术,以及越来越高的复杂度。

这些通用基础技术包括传感器融合和多模态感知,AI 规划和数据收集,深度神经网络,定位与地图构建,甚至核心技术也是一脉相承的:目前就是基于 VLA 大模型来给汽车和机器人进行外部环境理解和行为动作输出。

只是在环境的复杂性和产品活动的自由度等层面上,具身智能机器人和智能驾驶汽车之间,有着维度的区别。
但不管它们之间有何变化,其联系就仿佛用尺规作正多边形求圆周率那样,看起来正 16 边形比正 65537 边形简单,但前者却是后者的基础和必由之路,其方法论在一开始就奠定了。

高通技术公司执行副总裁兼汽车、工业及嵌入式物联网与机器人事业群总经理 Nakul Duggal 在 CES 2026 期间表示:

作为先进驾驶辅助(ADAS)系统等高能效、高性能系统领域的领军企业,高通深知如何让最复杂的机器人系统也能安全可靠地运行,并实现规模化部署。依托高通强大的基础技术以及不断扩展的开发者工具产品组合,我们正通过将智能设备从实验室推向真实环境,重新定义物理 AI 的可能性。

当然,技术评论者凯文•凯利在《What technology wants》里也有相似的论断:技术是一个整体,它像生物演化一样,有着内在的逻辑和趋向。

以 2022 年 11 月 ChatGPT 作为一次人类历史的断代,往前一年多的 2021 年,尤为擅长总结和预测人类历史的《人类简史》作者尤瓦尔·赫拉利使用了 ChatGPT 的前身 GPT 3.0 版本,并用它写了一段《人类简史》的再版序言。

他的震惊之情溢于言表,仅仅是因为 AI 模仿他的语气写了小小一段话。这是大语言模型技术泛起的涟漪波及了他,他马上就知道后面会如何掀起巨大的浪潮。

而现在,身处涟漪和浪潮之中的我们,自然也会明了,CES 上高通发布的这一切,与不久后会如约上演的春晚出现的 AI 工具与机器人,有何种联系。新技术的涟漪和浪潮最终会波及所有人,只是有人站得更靠前。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌