普通视图

发现新文章,点击刷新页面。
昨天 — 2025年4月25日阮一峰的网络日志

科技爱好者周刊(第 346 期):未来就是永恒感的丧失

作者 阮一峰
2025年4月25日 08:09

这里记录每周值得分享的科技内容,周五发布。([通知] 下周五一假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

大阪世博会的中国馆,以"中华书简"为主题。(via

未来就是永恒感的丧失

有一类人叫做未来学家(Futurists),专门研究未来。

这类人通常很快被忘记,因为他们的预测基本不准。就算偶尔说对了,后人也会觉得稀松平常。

历史上最著名的未来学家,大概是一个叫做阿尔文·托夫勒(Alvin Toffler,1928--2016)的美国人。

上个世纪七十和八十年代,他写过很多预测未来的书,非常畅销。1983年,国内就引进了他的书,轰动一时。

时过境迁,现在几乎没人提他了。

前些日子,一个朋友对我说,你可以去看看他的书,居然没有完全过时。

我看了一些片段,很震惊。这些片段根本不像写于半个世纪之前,更像写于现在。

托夫勒的第一本书,叫做《未来的冲击》,写于1970年,国内有中文版。

下面就是他的主要观点。大家一定要记住,这些话写于1970年,那个时候还没有信息革命,既没有个人电脑,也没有手机和互联网。

托夫勒认为,人类以前是农业社会,现在是工业社会,即将进入超工业社会

超工业社会有两个特征。

首先,工业人口只占少部分,大部分人从事脑力劳动。

其次,即使少部分人从业工业,生产出来的工业品,也大大超过需要。

那么,问题就来了。如果50%、甚至40%的工业生产能力,就能生产出满足所有人需要的工业品,那么会怎样?

托夫勒说,为了消化掉多余的工业品,结果就是加速。社会开始让消费加速,让技术也加速,最终让商品的流通速度变快,只有这样才能消费更多的商品。

这意味着,人类社会将变快。我们生活的根本特征,不再是持久,而是短暂

(1)生活用品变得短暂,越来越多一次性产品:一次性筷子,一次性圆珠笔,一次性塑料瓶,甚至一次性衣服。

(2)即使长期使用的产品,也在快速升级换代。微波炉、洗衣机这样的耐用消费品,人们也只要今年的型号,不要去年的型号。

(3)社会充斥着速成食品、速成教育,甚至城镇也可以速成。

(4)知识短暂化,用过即弃。

(5)工作变得短暂。职位、公司、甚至行业,随时都会消失,新的部门和行业不断涌现。

(6)生活环境变得短暂。人们经常搬家,不会在一个地方久居。

(7)人际关系变得肤浅。人与人之间很难产生稳定深入的关系,交流持续的时间缩短,更多的是偶遇和点头之交。

(8)人们面对快速变化,内心感到疲惫和衰弱,情绪变得不稳定,精神病人变多。

总之,未来的根本特征,就是永恒感的丧失,取而代之的是短暂感。

Trae 的 万「友」引力计划

本周,字节的 AI 编辑器 Trae 发了新版,可以调用 MCP 服务器了。

这可是重磅消息,开辟了一个全新天地,我还写了一篇教程

官方为了推广,投入了大量资源,Doubao、DeepSeek、Claude、Gemini、GPT-4o,现在都是免费用(后三个模型需要 Trae 海外版)。

为了让更多的同学参与,只要你深度体验 Trae,完成简单任务,就可以获得相应积分,兑换奖品。

奖品包括 华为 MatePad Air、雷蛇机械键盘、热门 App 会员卡等。

详情访问这个链接,或者扫描上方海报的二维码。

机会难得,既能学习 AI 和 MCP,还能拿奖品,大家不要错过哦。

科技动态

1、虚拟味觉

香港城市大学的科学家,提出了一种虚拟味觉的实现方法。

他们做了一个类似棒棒糖的"虚拟味觉器",用户把它含在嘴里。

它会以"离子泳"的形式,释放水凝胶。目前,一共9种口味的水凝胶,也就是说用户可以尝到9种味道:糖、盐、柠檬酸、樱桃、百香果、绿茶、牛奶、榴莲和葡萄柚。

这里的关键是,水凝胶的释放可以编程控制,因此可以用来在电子游戏中增强用户体验,或者网上购物时让用户先品尝食品味道。

2、旅行推销员问题是一个著名的计算机科学问题。

它的表述是,怎么规划出一条最短路线,可以拜访每一座城市一次,最终回到起始城市。

最近,一个国际团队打破了旅行推销员问题的世界纪录

他们规划出一条最短路线,可以一次性走遍韩国所有81,998家酒吧。

一刻不停的步行,完成这条路线一共需要178天。

此前的世界纪录是2021年创造的,走完荷兰57,912个纪念碑的最短路线。

3、Vision Pro 的新用途

苹果的 AR 头盔 Vision Pro,售价高达3万元人民币,销量并不好。

用户普遍觉得,它的用处并不大,售价又这么贵。但是,它意外在一个场合非常受欢迎。

美国的一些医院发现,它可以用于微创手术。医生戴着头盔,给病人开刀,上图就是两个这样的医生。

很多手术,尤其是涉及血管和神经的手术,要求非常精细,动刀位置不能有一点差错。

医生不可能凑上去看,现在都是用摄像头放大后,看着显示器动刀。

Vision Pro 戴在眼前,影像更大,看得更清楚,而且还能叠加多窗口,显示心率血压等指标。

医生非常喜欢这个设备。价格完全不是问题,因为手术用显示器的价格是 Vision Pro 的好几倍。

4、其他

(1)北京举行机器人半程马拉松比赛。21公里的路程,冠军成绩是2小时40分42秒,需要更换三次电池。

(2)4月25日的日出前,土星、金星、月亮,将组成笑脸图案

(3)亚马逊在欧洲实验,让送货卡车配备心脏除颤器,一旦送货时遇到突发心脏病的人,可以进行急救。

(4)索尼推出全球最小的激光雷达,适合用于无人机、机器人。

文章

1、昊龙:中国首个货运航天飞机(中文)

天宫空间站的补给,目前由天舟飞船完成。但是,天舟每次返回大气层,都会烧毁。

国内正在研究可以重复使用的"昊龙"货运飞船,以降低货运成本。

昊龙已经完成了设计,正在工程测试阶段。

2、如何使用 UTM 在 Mac 电脑架设虚拟机(英文)

一篇教程,教你如何在 MacBook 安装 utm 虚拟机,从而方便地使用 Linux 系统。

3、清理<head>(英文)

网页的<head>部分里面,很多标签是不必要的,这个网站介绍可以删除的标签,比如 favicon、Apple touch icons。

4、线上故障应急处理:4 年多 on call 经验总结(中文)

我的第一份工作是 CDN 基础设施研发,考虑到公司体量,那些年其实故障蛮多的。在故障处理中,积累了一些经验教训,总结回顾一下。(@swananan 投稿)

5、在 Docker 沙箱中运行 MCP Server(中文)

本地运行他人的 MCP 服务器有极大的风险,本文介绍怎么在 Docker 沙箱里面运行。(@ccbikai 投稿)

6、如何用 Whisper 生成字幕(英文)

本文是作者的操作记录,演示如何用 OpenAI 公司的 Whisper 模型为视频文件生成字幕。

工具

1、Open Props UI

一个 CSS 组件库,使用最新的 CSS 规范,也就是说,不考虑兼容老旧浏览器。

2、ts-blank-space

一个从 TypeScript 脚本剥离类型代码的工具,也就是将 TS 脚本转成 JS 脚本,但是不进行类型检查。

3、Better Auth

一个 TypeScript 的用户身份认证库,功能全面,密码登录、双因素认证、外部身份提供商等都支持。

4、Browspilot

Chrome 浏览器插件,自动保存所有浏览过的网页,提供浏览历史的全文搜索。

5、to-unocss

这个网页工具将 CSS 代码转成 unoCSS 或者 TailwindCSS 的写法。(@Simon-He95 投稿)

6、NoteGen

跨平台的 Markdown 笔记软件,支持接入 AI 模型。(@codexu 投稿)

7、speed-github

一个修改 hosts 文件,加快 GitHub 访问速度的 Python 脚本。(@jvxiao 投稿)

这里还有一个 Cursor 的 hosts 文件生成器。(@Oliverwqcwrw 投稿)

8、旅游翻译器

网友做的旅行翻译网站,支持对话翻译和拍照翻译,代码开源。(@traveltranslator1 投稿)

9、Shui

开源的桌面软件,定时提醒喝水。(@rock-zhang 投稿)

10、SnowAdmin

基于 Vue + Vite 的网站管理后台模版。(@WANG-Fan0912 投稿)

AI 相关

1、chatlog

用 AI 处理微信本地聊天记录的工具。(@sjzar 投稿)

2、HowToCook-MCP Server

一个 MCP 服务器,提供中文菜谱、餐食规划。(@worryzyy 投稿)

3、Midscene.js

字节推出的 JS 工具,最新功能是通过 AI 和 adb,完成安卓手机自动化。它早先已经可以浏览器自动化。(@yuyutaotao 投稿)

4、MCP Gateway

一个 Go 语言写的网关服务,将已有的 API 转成 MCP 服务,无需改动任何代码。(@iFurySt 投稿)

资源

1、全球地铁线路图

这个网站收集了全球各大城市的地铁地图。(@027xiguapi 投稿)

2、如是我闻

佛经阅读平台,带有 AI 翻译和问答。(@bolechen 投稿)

3、They see your photos

该网站对用户上传的照片给出详尽描述,从而可以发现照片泄漏了多少信息。

日本木匠大会

日本每年举行一次全国木匠大会

大会有一个项目,就是刨花比赛,看看谁的刨花最薄。

比赛规定,木材必须是宽55毫米、长1800毫米的桧木。进入决赛的5名选手,为了公平,将使用同一块桧木。

刨出来的刨花必须完整,没有裂口,长度在1米左右,才能参加评分。

工作人员把所有选手的刨花,挂在黑板上,进行公示,评委进行打分。

这些的刨花如此之薄,令人不敢相信。

冠军选手的成绩是50微米,也就是1毫米的20分之一。

文摘

1、你是创造者还是消费者?

我是一个信息瘾君子,对各种信息上瘾。

当我想学习一项新技能,或者有了一种新爱好,我就立即前往亚马逊网上书店,购买3~4本该主题的书籍。

现在我的书柜里面、有关于 HTML 基础知识、纸牌魔术、高尔夫、编剧、赛车、冥想、举重以及大约10个其他主题的书籍。

我也会订阅一些博客和播客,阅读所有最受欢迎的帖子,聆听了各种专家访谈。有时候,我甚至会在 Evernote 做一些笔记,或者在浏览器为某些页面添加书签。

然而,我总是缺少一件事:实际成果。

我对那么多东西感兴趣,也学了很多,但是没有做出什么成果。

我只是查找和使用信息,这很容易,对于像我这样好奇的人来说,这通常也非常有趣。

但它实际上并没有完成任何事情,这是伪工作,一种自我安慰。

创造才是更有效的方式,你开始制作东西----网站、成功的高尔夫击球、剧本等等,不管是什么----然后,无非就是两种结果。一种结果是你意识到自己对它不那么感兴趣,另一种结果是你真的喜欢它,开始深入研究。无论哪一种结果,都是值得的,而盲目消费信息,则是一种无效的表面行为。

言论

1、

AI 伴侣可以减少孤独感,但是会产生新的问题。它可能取代人际互动,让你丧失基本社交技能,从而变得更加孤立。

-- 哈佛商学院的一项研究

2、

简单和优雅不受欢迎,因为它们需要努力工作和纪律才能实现。

-- Edsger Dijkstra,著名计算机科学家

3、

规则就像汽车上的安全带:一开始可能会有点不舒服,但一段时间后,使用规则就会成为习惯,不使用规则就变得不可想象。

---- Gerard J. Holzmann

4、

企业编程必须始终依赖流程,而不是个人。

个人能力很重要,应该鼓励,但不能指望它,否则软件质量将不一致,没有可持续性。一旦顶级程序员跳槽,公司就会陷入困境。

企业应该努力改进工作流程,而不是努力改进人员,始终坚持流程优先于人员。

-- 《创作系统,而不是创造英雄》

5、

我喜欢软件,因为软件可以创造无限可能性和一种非凡的民主。

-- Hacker News 读者

往年回顾

AI 的关键是语料(#299)

最成功的软件企业家(#249)

俄罗斯的 HTTPS 证书问题(#199)

新能源汽车,谁会是赢家?(#149)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月25日
昨天以前阮一峰的网络日志

巨头的新战场:AI 编程 IDE(暨 字节 Trae 调用 MCP 教程)

作者 阮一峰
2025年4月22日 15:08

一、引言

本周,我要加写一篇文章。

因为 AI 编程 IDE 突然成了热门,国内外都有大事发生。

先说国外,OpenAI 要用30亿美元收购 Windsurf

这个消息太惊人。Windsurf(前身叫做 Codeium)的历史很短,发布至今两年多,市场份额也不高,居然值这么多钱!

OpenAI 最新一轮融资(今年3月)不过400亿美元,现在一下子要拿出30亿去收购,看中 Windsurf 哪一点呀!

OpenAI 自己没有编程助手,所以唯一的解释是,它要收购 IDE 打入 AI 编程市场,这个市场对它很重要。

二、MarsCode 更名 Trae

再看国内,字节也有大动作。

它旗下的编程助手,最早是 MarsCode 插件,后来又多了一个独立的 AI IDE 产品 Trae

本周,MarsCode 宣布改名为 Trae 插件,不再作为独立品牌发展了。

以后,字节的 AI 编程助手,将只有 Trae 这一个品牌,分成两种产品形态。

习惯传统 IDE 的用户,可以加装 Trae 插件;想要更好 AI 体验的用户,可以安装独立的 Trae IDE。

这个消息公布的同时,Trae 新版本也一起发布,加入了重磅的新功能(后面会详谈)。

可以看出,字节是下了决心,整合了产品,准备在 AI 编程工具上发力了。

三、AI IDE + MCP

为什么国内外的巨头,在同一个时间,不约而同都看上了 AI IDE?

我猜想,答案是 MCP 的出现。

有了 MCP 以后,AI IDE 可以扩展外部能力,从而无所不能,这让它成为巨头的必争之地。

下面,我来解释 MCP 是什么,怎么在 Trae 里面调用。大家看了,就会理解为什么 MCP 这么重要。

四、Trae 的简介

我选择 Trae 来演示,主要因为它是国产软件,有中文界面和文档,并且完全免费(国外产品都需要付费)。

前面说过,Trae 分成插件和 IDE 两种形态,它的 IDE 又分成国内版和海外版。这些产品的功能基本一致,就是内置的 AI 模型不一样。

国内版:内置 deepseek R1、V3、v3-0324 和 doubao 1.5 pro 模型

海外版:内置 Claude 3.5、3.7,Gemini 2.5 pro,GPT-4o、GPT-4.1 模型

我建议使用国内版,因为海外版的内置模型经常需要排队,很浪费时间,而且可能还会通信不畅。

不过,这两个版本都支持自定义模型,你可以提供密钥,接入你指定的模型。所以,版本的差别也不算很重要。

顺便提一下,Trae 这个词的意思是"The Real AI Engineer"(真正的 AI 工程师)。我以前总是以为 Trae 的意思是 True Ai。

五、Trae 的新版本

Trae 的 MCP 调用功能,是从新版本 v0.5.0 开始加入的。

没安装的朋友,可以去官网下载新版。已经安装的朋友,请检查一下版本。

它的界面这一次简化了,聊天框和 Builder(项目生成)合并成一个对话框(下图)。所有跟 AI 的对话,都在这里输入。

上图中,左下角多了两个按钮:"@智能体"和"#上下文"。这就是本次新增的核心功能。

至于 Trae 的基本用法,这里就不提了,可以看以前的文章

六、调用智能体

MCP 调用的入口,就是上图左下角的"@智能体"按钮。

如果想要扩展 AI 的功能,就要使用这个按钮。因为 AI 模型的本质只是语言模型,自身的功能是有限的,必须通过外部应用(智能体)来扩展功能。

点击"@智能体"(或者输入@),就会弹出一个对话框,显示目前可用的智能体(下图)。

可以看到,Trae 内置了两个智能体:"@Build" 和 "@Builder with MCP"。

其中,"@Build"用来让 AI 生成一个可运行的新项目。

@Build 俄罗斯方块网页小游戏

输入上面的命令,就会生成一个 HTML 文件,打开就是俄罗斯方块小游戏。

另一个内置的智能体"@Build with MCP",就是用来连接 MCP 服务器。

七、MCP 是什么

我先解释一下,MCP 是什么,很容易理解。

我们知道,AI 模型通过连接外部应用,来扩展功能。每个外部应用的接口,都不一样,如果要接入10个应用,就要写10种接入代码,非常麻烦。而且,要是换一个模型,可能所有接入代码都要重写。

有鉴于此,Anthropic 公司在2024年11月提出了 MCP 协议。外部应用只需要支持这个协议,提供一个 MCP 接口(又称 MCP 服务器),那么 AI 模型就可以用统一的格式接入,不需要了解外部应用的接入细节。

所以,MCP 可以理解成一个 AI 与外部应用之间的适配层。对于 AI 来说,只要安装某个应用的 MCP 服务器,就能接入该应用,不用写任何代码(除了少数的配置项)。

由于 MCP 解决了 AI 应用的接入痛点,诞生至今仅半年,已经变得极其流行,就连 Anthropic 的竞争对手 OpenAI 公司都公开支持,网上开源的 MCP 服务器项目已经有上万个。

八、调用 MCP

现在就来看 Trae 怎么调用 MCP。

点击 AI 标签栏右上角的齿轮图标,弹出一个菜单,选择菜单项 MCP。

它会跳出一个 MCP 的标签页(下图),点击底部的"+ 添加 MCP Servers"。

Trae 内置了 MCP 市场,提供一些常用的 MCP 服务器。如果里面没有你需要的,可以点击"手动配置",添加你自己的 MCP。

为了便于演示,我选择第一个服务器 Puppeteer,让 AI 可以调用无头浏览器。

鼠标点击 Puppeteer 的名字,会进入该开源项目的主页,可以查看一下它提供的内部命令(即能力)。

上图中可以看到,这个 MCP 服务器提供 puppeteernavigator(打开指定网址)、puppeteerscreenshot(截图)、puppeteer_select(选中页面元素)等内部命令,供 AI 模型调用。

用户不需要记住这些命令,只需了解它有哪些能力就可以了。

接着,点击它后面的加号,添加该 MCP 服务器。

这个 MCP 带有"轻松配置"标签,表示不需要任何设置,可以直接运行。

所有自己添加的 MCP,默认都放在内置的智能体"@Build with MCP",所以可以通过这个智能体来使用。

在 AI 对话框里面,选中智能体"@Build with MCP",然后输入下面的命令"打开 https://www.baidu.com",试试看新安装的 Puppeteer 服务器。

正常情况下,Trae 会让你选择一个项目文件夹,然后就会打开一个浏览器窗口,显示百度的首页。

这就是 MCP 的作用。AI 本来没有能力控制浏览器,但是现在就可以通过 MCP 来控制。

接着,可以给出一些更复杂的命令,比如生成截图,也能顺利完成。

这就是调用 MCP 的基本流程。你还可以把添加的 MCP 服务器保存成智能体(下图)。

然后,通过你起的名字,调用该智能体(下图),从而连接指定的 MCP 服务器。

九、上下文功能

除了 MCP 调用,Trae 的本次更新,还加强了上下文功能,这里也简单提一下。

所谓上下文,就是额外提供的信息,帮助 AI 模型思考,来完成任务。

通过#号,可以调出上下文菜单。

从上图可以看到,可以提供的上下文,包括额外的代码(code)、文件(file)、目录(folder)、工作区(workspace)。

本次更新多了两个选项,"Doc"表示额外的文档。

点击"添加文档集",就可以添加文档目录,作为 AI 模型的上下文。

另一个选项"Web",表示用网上信息作为上下文。这为 AI 提供了实时联网能力。

上图的实时天气问题,AI 只有具有联网能力,才能回答。

十、总结

有了 MCP 调用和联网能力,AI IDE 就具备了巨大的想象空间,不仅仅是编程工具,而成了一个无所不能的 AI 控制台。

那些大公司一定是看到了这一点,所以才愿意投入大量资源,去做这个产品。

我认为,在 AI IDE 里面调用 MCP 服务器,将成为近期软件业的热点,值得大家重点关注。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月22日

办公类 AI 初探:扣子空间

作者 阮一峰
2025年4月21日 10:50

一、AI 的风口

问问大家,AI 产品的风口是什么?

我的意思是,什么样的产品有最大的机会。

现在的 AI 多如过江之鲫,大部分都是昙花一现,走不远。

在我看来,最有机会的产品,既不是面向普通大众的问答类 AI,或者内容生成 AI,也不是面向开发者(API 用户)的编程 AI。

真正的风口是办公类 AI

企业和个人的办公市场巨大无比,而且有真金白银。

谁能把 AI 引入文档、会议、决策......,谁就会吃到肉。就像 Office 软件是商业软件之王一样,企业级办公 AI 也一定会是 AI 的销售之王。

二、办公类 AI 的现状

不过,办公类 AI 眼下寥寥无几。不要说赢得市场,就连想得起名字的产品都不多。

究其原因,一是 AI 现阶段的能力,还达不到企业级软件的安全、稳定、准确、高效。

二是办公类 AI 到底是什么样的产品形态,大家还在摸索。

我一直非常关注这个领域,对于新出现的办公类 AI 有着强烈的兴趣。

下面介绍一个新产品"扣子空间",我这些天一直在试用。大家看看,它怎么用 AI 完成办公任务。

三、扣子空间

先说一下,扣子(coze.cn)是一个国内的平台,提供基于浏览器的低代码环境,来搭建 AI 应用,有免费额度。

我一直是它的用户,以前还写过文章,介绍它的工作流模式:在图形化界面上,用鼠标编排 AI 工作流,生成独立应用。

工作流模式号称不需要编码,小白也能用,但用户最好有编程基础,所以还是有一点点门槛。

于是,扣子现在又推出了"扣子空间",真正零基础,无门槛完成任务。

它的最大特点是,内部自动调用各种 Agent(智能体),不需要用户介入,就能完成各种任务。你可以把它想象成一个"Agent 的自动调用器"。

对于用户来说,因为有了底层的 Agent 能力,它不仅可以回答问题,还能解决问题(任务),从而成为你的办公助手和工作搭子。

正如它的宣传语:"和 Agent 一起开始你的工作"。

注意,它现在需要邀请码,可以去扣子公众号和扣子空间官网(space.coze.cn)领取。

四、界面

扣子空间的网址是 space.coze.cn,点进去就可以使用。

界面很简单,左侧是任务列表,右侧是一个对话框,用来输入新任务。

执行任务要求时,默认是"探索模式",AI 自动完成各个步骤,速度较快。

你也可以改成"规划模式",显示 AI 思考的中间步骤,便于随时调整。

除此以外,就没有需要设置的地方了,很符合直觉。

五、任务示例

下面是我的一些使用实例,都是办公类的任务。

大家看看,它完成得怎么样,像不像一个精通各种技能的实习生。

5.1 撰写研究报告

最常见的办公任务,肯定是撰写文档。我让 AI 撰写下面的研究报告。

我需要一篇研究报告,关于上海茶饮行业近几年的发展情况,以及投资机会的分析,包括行业发展、热门产品等信息。

注意,文档类的任务最好指定输出格式,否则生成的内容以 Markdown 格式展示在对话页上,不方便利用。

我一般是在提示词最后,加上这样一句。

同时做一个可视化的网页。

开始运行后,它就会分解任务,按步完成。

最后,它给出生成的 markdown 文件和网页文件。

你可以在新窗口打开网页预览。下面就是它生成的网页,图文并茂,有数据也有论述。

整个报告分成四个部分,可以根据需要增减,自己使用或交差,总体上没有问题。

5.2 多种输出格式

前面说过,扣子空间内置了各种 Agent。

除了生成网页的 Agent,还有生成 Office 文档、PDF、飞书文档的 Agent,都可以用,下面是一个例子。

帮我比较一下T3、滴滴出行、高德,作为新手网约车司机,在重庆跑,哪个平台最推荐,并说明详细原因,输出一份飞书文档。

由于飞书文档是带有布局的,实际生成时,也是从文字报告生成网页,然后系统提示你将网页内容复制到飞书。

如果输出 PDF 文件或幻灯片 PPT 文件,系统会直接给出文件下载。

我正在编排行程,目的是安徽皖南地区,包括黄山和当地的其他风景点,请详细研究行程、交通路线、景点介绍、门票、住宿和当地饮食等信息,形成一份完整的行程安排,以 PPT 形式展示。

它生成了一个28页的 PPT 文件,下载后,完全可以直接上台演示。

5.3 表格能力

办公类的 AI,一定要有表格处理能力。

请生成一个表格,包含上证50指数成分股,及其最新的收盘价。

默认情况下,表格生成后,会显示在网页上。

系统还会给出一个 csv 文件,供下载。

如果想要完备的电子表格功能,可以把 csv 文件导入电子表格软件。

5.4 其他功能

扣子空间内置的 Agent 很多,还可以调用高德地图、生成网页游戏等等。

请生成一个互动式的学习网站,帮我学习 CSS 的 oklch 颜色函数。

上面是网页小游戏的例子,下面是调用地图的例子。

用高德地图分析一下上海外滩地区所有瑞幸咖啡的门店选址,做成一个可视化的网页给我。

如果内置的 Agent 不足以满足需求,你还可以设置让它接入各种 MCP,扩展能力。

5.5 专家系统

最后,它还自带了专家系统,也就是高级的专业知识库,提供深度的分析能力。

目前,内置了两个专家系统:用户研究专家和 A 股观察助手。

前者用来用户问卷调查、访谈、生成分析报告;后者用来分析自选股和大盘,提供研究分析报告。

深度的分析和处理任务,需要特定的专业知识,可以试试它们。

六、总结

经过初步的试用,我对扣子空间评价很好,非常好用的办公助手和 AI 实习生,确实能够提高办公效率。

我觉得,它的设计思路很正确,自动调用各种 Agent,既能扩展各种能力,又能消除了上手难度,同时具备深度研究(deep research)能力。

更难得的是,它的完成度相当不错,没遇到明显的 bug,可以用于实际的办公。

总之,作为办公类的 AI 产品,它的"工作搭子"的模式,我觉得可用也可行。

后面,办公类 AI 产品相信会大量涌现,鉴于它的重要性,我还会介绍和评测更多。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月21日

科技爱好者周刊(第 345 期):HDMI 2.2 影音可能到头了

作者 阮一峰
2025年4月18日 08:07

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

湖北宣恩县的竹筏夜游,两岸灯火辉煌。(via

HDMI 2.2 影音可能到头了

今年一月,有一个消息,大家可能没关注,那就是 HDMI 接口发布了2.2版

今天说说这件事,我冒着打脸的风险,猜测一下,这个标准可能到头了。

HDMI 接口是最常见的影音接口,每个人应该都接触过,电视机和显示器一般都用它连接信号源。

这个接口一直在升级,每次升级都会提高信号的传输速率。

  • HDMI 1.0-1.2(2002):4.9Gbps
  • HDMI 1.3-1.4(2006):10.2Gbps
  • HDMI 2.0(2013):18Gbps
  • HDMI 2.1(2017):48Gbps
  • HDMI 2.2(2025):96Gbps

从上表可以看到,HDMI 接口的每次升级,信号的传输速率都会翻倍。这是为了应对现在的视频,越来越高清,数据量越来越大。

这一次,从2.1版升级到2.2版,速率从 48Gbps 加大到 96Gbps。

96Gbps 这个速率,大到吓人

这是什么概念?最快的家庭网络现在是万兆网络(10Gbps),一般人根本不需要这么快,而 HDMI 2.2 比它还快10倍!

这是最快的影音接口,即使目前最高清晰度的视频,它可以同时传输多部,还有多余的带宽。

问题是,你用不到它。4K + 60帧 + HDR10 或杜比视界效果的视频,只需要 HDMI 2.0 就能实时传输。

8K + 60帧的视频,要用到 HDMI 2.1,而 HDMI 2.2 支持 12K + 60帧的视频

可是,人们真的会在电视机上观看 12K 分辨率的视频吗?

大家可能听说过一个词"视网膜分辨率"(retina display),指的是人眼能够感知的最高分辨率。

超过这个分辨率,人眼就感知不到清晰度的提高,再提高分辨率就毫无意义。

2010年,乔布斯在发布 iPhone 4 时,提出了这个概念。他说,正常距离25-30厘米时,肉眼感觉不出 iPhone 4 屏幕的像素点。

视网膜分辨率跟两个因素有关:观看距离,屏幕大小。

屏幕越大,距离越近,所需要的分辨率越高;屏幕越小,距离越远,所需要的分辨率越低。

国外有人计算过,普通的家庭影院,坐在距离3.6米的地方,观看 12K 视频,屏幕可以大到550英寸,也能达到视网膜分辨率

550英寸相当于宽12米,高6.8米,也就是广告牌大小!

换句话说,小于550英寸的屏幕,根本不需要 12K 分辨率。即使用到了,也是浪费,因为肉眼分辨不出这样的清晰度。

所以,普通家庭根本不需要 12K 分辨率。客厅里面,4K 电视机就能达到视网膜分辨率。

现阶段,视频效果的提升,主要已经不是通过分辨率了,而是通过色彩准确度、对比度(动态)等指标了。

音频也是如此。对于一般人的耳朵,CD 音质已经接近立体声的听觉极限,再提高也分辨不出来。它只需要 USB 2.0 (480Mbps) 就可以实时传输。

总之,影音标准在技术上还可以继续提高,但是人类的感官是有极限的。现有的技术已经达到感官的极限了,传输速率再提高,收益只会越来越少。

反正,我想象不出来,如果未来推出 HDMI 的2.3版或3.0版,传输速率将有多大,又是要满足怎样的场景?

科技动态

1、加州禁止"保质期"

美国加州通过一项法律,从2026年7月开始,食品不得标识"保质期",而要改成"最佳食用日期"(Best Before)。

因为保质期往往被当作可食用的最后日期,一旦过期,食品就要下架,非常浪费。

实际上,保质期是指该日期之前,口味最佳。

据估计,保质期让美国33%的食物被浪费。这次的新法律,允许过期后食品继续留在货架上,每年可以让加州少浪费7万吨食品,大约节省3亿美元。

2、本周开幕的大阪2025世博会,建造了一个全世界最大的木结构建筑

那是一个圆形的环,周长2公里,象征世博会参展国之间的团结。

3、升降人形机器人

日本 JR 铁路公司有很多高空电线,维修人员不足,而且高空作业也很麻烦危险。

他们就别出心裁,在升降机上装了一个人形机器人。

这个机器人做成了漫画《机动战士高达》的样子,还特别将摄像头做成了两只眼睛。

底下有操作员,将机器人升到高空,进行作业。所以,它也不是智能的,更像拉线木偶。

4、其他

(1)传统的微软死机"蓝屏"画面,可能改变。

Windows Insider 最新的更新包,将死机画面改成了黑屏(下图),类似于 Windows 更新画面。

(2)Notion 推出邮件服务,目前只能用于连接 Gmail 邮箱。

(3)网站 TLS 加密证书的有效期,将缩短为47天,2026年开始生效。

文章

1、我们正在进入大芯片时代(英文)

大芯片指的是 CPU、GPU、内存封装在一块芯片里面,典型代表是苹果的 M 系列芯片。

这种设计使得 CPU 和 GPU 共享内存,并且有极大的内存带宽,这就是为什么苹果电脑不需要 Nvidia 显卡,也能运行 AI 模型。

2、我放弃了笔记本,只用袖珍电脑 + AR眼镜(英文)

作者介绍他现在外出所携带的电脑设备:一个袖珍电脑,一个移动电源,一副 AR 眼镜和移动键鼠。

3、为什么大写字母的二维码小于小写字母(英文)

作者指出一个有趣的现象,如果把网址全部转成大写字母,再生成二维码,会小于小写网址的二维码(更稀疏)。

4、JS 性能测试的一个技巧(英文)

通常测试 JS 代码的性能时,会使用循环,但是循环本身有开销。作者介绍消除循环开销的一个技巧,就是分成两个循环,前一次循环执行一次代码,后一个循环执行两次代码,后者再减去前者。

5、让你的 RSS/Atom feed 更好看(中文)

一篇简单教程,介绍如何为 XML 格式的 RSS 文件加入样式。(@Spike-Leung 投稿)

6、text-wrap 的新设置(英文)

text-wrap 在 CSS 里面用来控制文本换行。它有两个新设置 text-wrap: pretty 和 text-wrap: balance。

工具

1、yabs.sh

一个用来测试服务器性能的 Bash 脚本,参考这篇教程

2、Pākiki Proxy

一个跨平台的桌面应用,用来拦截本机的 HTTPS 和 Websocket 通信,进行查看和编辑。

3、Giant Log Viewer

一个跨平台的桌面软件,轻松打开和查看极大体积的文件(可以到 TB 级)。

4、OpenAPI DevTools

一个 Chrome 插件,可根据网络请求实时生成 OpenAPI 规范的 API 描述。

5、Online 3D Viewer

一个开源的在线 3D 文件浏览器,支持多种文件格式。

6、Tirreno

开源的访问者分析系统,基于 PHP。

7、EaseVoice Trainer

一个本地的声音克隆软件。(@xxx7xxxx 投稿)

8、Lexe

Node.js 应用打包成单个可执行文件,基于轻量级 JS 运行时 LLRT,打包体积小。(@Ray-D-Song 投稿)

9、Treex

开源的命令行工具,用来输出目录的树状结构,有多种输出格式和过滤选项。(@shiquda 投稿)

10、py-xiaozhi

一个使用 Python 实现的小智语音助手,支持语音交互、物联网设备控制、联网音乐播放等功能,无需专用硬件。(@huangjunsen0406 投稿)

AI 相关

1、PureChat

开源的 AI 聊天应用,可以接入 OpenAI、Ollama、DeepSeek 等大模型,基于 Vue3 和 Vite5 开发。(@Hyk260 投稿)

2、Vanna

一个开源的数据库分析 AI,用自然语言向数据库询问,它会自己生成 SQL,并给出运行结果。(@904192063 投稿)

3、AI 视频图文创作助手

将任意视频/音频,转化为各种风格的文章,可在本地部署。(@hanshuaikang 投稿)

资源

1、Flight Track in 3D Earth

在 3D 地球仪上,显示某个航班的飞行路线。(@foru17 投稿)

2、欧洲夜班火车地图

这个网页的设计制作,让人过目难忘,可以借鉴。点击线路,会有详细信息的弹窗。

3、市场结构入门(Market Structure Primer)

一本英文电子书,向新手介绍美国证券市场的结构,如果想参与美股,可以读读。

生成随机数的波浪机

世界最大的 CDN 服务商 Cloudflare,在世界各地的办公室,各自部署了一个奇怪的技术装置。

这些装置可以生成无法预测的随机数,用于通信加密。

比如,旧金山总部的熔岩灯。

每时每刻,每盏灯的颜色和图案,都在变化,计算机处理后就是不一样的随机数。

伦敦办公室则是"单摆墙",每一盏都在摆动。

奥斯汀办公室是反光片天花板,任何气流都会让反光片转动。

周刊305期详细介绍过这些装置。

上个月,Cloudflare 里斯本办公室开张了,又新增了一个装置。

那是50个波浪机,组成了一面墙。

每个波浪机就是一个透明的长条容器,里面装着蓝色、绿色或者橙色的液体。

电力驱动波浪机的马达,容器每分钟翻转14次,每天超过20,000次。里面的液体随着容器翻转,形成波浪运动。

波浪机背后的反光板,会放大液体流动的光影效果,从而适合用来生成随机数。

文摘

1、韩式可爱

我很喜欢韩国首尔,过去四年已经去过了七次。

我注意到,首尔到处都是可爱的装饰物,令人应接不暇,根本无法逃避。所有东西都弄得像卡通人物。

人们都在大肆购买毛绒玩具。

小吃店的宣传招牌上,卡通章鱼甚至涂了口红,那是你最终会杀死然后吃掉的章鱼。

我觉得,韩国的年轻一代似乎通过拥抱可爱的东西,来应对猖獗的消费和物质主义,以及由此产生的空虚。

如果你把任何事物都塑造成可爱的形象,就能淡化生活的沉闷,避免那些严肃的问题,让消费主义没那么毫无意义了。

我完全接受把任何事物拟人化。但当它变成一种世界观时,就相当令人沮丧了。

在首尔,可爱文化几乎成了一种世界观。韩国年轻人用这种方式,应对没有灵魂的未来。

可爱文化虽然肤浅,但在消费社会却非常合理。更多可爱的毛绒玩具,产生更多的快乐,你购买越多,满足感越大。

一个幸福满足、运转良好的社会,需要有某种形式的信仰和美学,提升生活,超越物质。

但是,试图用可爱来做到这一点,只不过是一种自欺欺人。

言论

1、

科幻电视剧《黑镜》完全是技术悲观主义,只谈技术的风险,不谈技术变革让现在的生活比过去好。它传播对未来的恐惧,让人们惧怕技术变革。

但是,如果我们想要更美好的未来,就只有依靠技术。

-- 英国《卫报》

2、

我的编程风格是"面向痛苦的编程"。什么问题让我痛苦,我就去解决它,最痛苦的,最先解决,不痛苦的,就不去碰它。

这种编程可以确保你始终在做重要的事情,从而极大地降低了风险。

-- 《面向痛苦的编程》

3、

现在的社交媒体,不看重优质内容,而看重互动,看重通过货币化和 AI 吸引更多的流量。

这导致用户会被欺骗,会被诱导产生情绪波动,而看不到真正的创作和真实性。

-- 《没有人应该成为"内容创造者"》

4、

黑客的学习方法是,开始玩某件东西,然后转头去读文档,继续玩这件东西,再次阅读文档,接着玩下去,再次阅读文档......不断重复,直到搞懂。

-- 黑客手册

往年回顾

轮到硬件工程师吃香了(#298)

不要夸大 ChatGPT(#248)

美国制造是否可能(#198)

微增长时代(#148)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月18日
❌
❌