普通视图

发现新文章,点击刷新页面。
昨天 — 2025年7月25日阮一峰的网络日志

科技爱好者周刊(第 358 期):如何拯救一家濒临倒闭的创业公司

作者 阮一峰
2025年7月25日 08:03

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

深圳罗湖区翠竹外国语学校,地处闹市。为了给学生增加活动面积,将屋顶建成梯田式的操场和绿地。(via

如何拯救一家濒临倒闭的创业公司

上周,Medium.com 的 CEO 发表了一篇长文,透露2022年曾经濒临倒闭。

"我们每月亏损260万美元。"

这不意外,它是一家博客托管平台,现在是短视频的时代,文字网站都活得很艰难。

"订阅用户在流失,平台上的垃圾文章越来越多。出资者不愿意再投入资金了(我们确实不值得投资),也找不到人愿意收购我们。"

意外的是,三年后,它还没死,并且盈利了。

它怎么活下来的?那篇文章透露了答案。

"我们决定最后试一次,如果不能扭亏就关门。"

凡是能用的常规操作,他们都用了,完全可以当作教科书。大家了解一下,万一公司要倒闭了,管理层会怎么做。

(1)裁员

他们高峰期有250名员工,目前只有77人,员工规模缩减了70%。

"如果还是250人的团队,即使业务好转,我们也肯定破产。"

(2)办公室退租

以前,他们在旧金山租了一个120个办公桌的办公室,每月租金14.5万美元。

现在全部退租,一年可以省下100多万美元。

(3)远程办公

疫情期间他们远程办公,员工都在家里干活。疫情结束后,发现公司可以这样运作,而且省钱,于是决定保持下去。

"我们现在致力于成为一家完全远程办公的公司,办公室的概念已经永远没有意义了。"

(4)业务重组

凡是盈利少、成本高的业务,全部砍掉。他们原来有一支高级编辑团队,负责制作高质量的内容。但是现实是,优质内容看的人并不多。

"我们平台上点击最多的文章,标题都是点击诱饵,它们的制胜策略是:找一篇维基百科文章,作为知识点,配上一个病毒式传播的标题,再加一些夸张的个人情感故事,然后从我们这里领取流量奖金。最高的一篇赚到了2万美元。"

他们别无选择,取消了高级编辑团队,调整了文章奖励。底下几家从事其他业务的子公司,也全部关掉。

(5)债务重组

他们有很沉重的债务,是从出资人借来的,已经有3700万美元逾期,根本无力归还。

另外,出资人还有优先清算权,就是说公司清算时,出资者可以优先于员工拿回资金。这让出资人有动机推动公司破产。

他们就跟出资人谈判,要求取消优先清算权,并将债务转为股本。如果不同意,公司就会破产,出资人可能什么拿不回来。

(6)重新协商员工股权

创业公司招人,都会给股权/期权,这些本质上都是公司债务。

如果不想破产,员工的股权/期权也必须甩掉,简单说就是缩水或者作废,否则无法进行新的融资,对于同意放弃一部分权益的出资人也不公平。

"我打电活给几位老员工,告诉他们股权缩水了。不这样做,我们就会破产,他们的股权很可能一文不值,现在重新估值可能还会值一点钱。更重要的是,这样也可以让他们创建 Medium 的努力不会白费。"

(7)总结

上面就是 Medium 起死回生的措施。

如果你想效仿,一定要记住,这些措施有一个前提:Medium 有现金收入(会员费),只是成功过高,所以值得试一下,压低成本求生。

大多数创业公司的现实是,几乎没有现金,全靠烧钱支撑,也没有市场份额。这样的公司不值得拯救,理性的做法是尽快止损

有一句至理名言"failing fast)"(快速失败),说的就是这种情况。如果注定失败,资源越早释放越好,转投更有前景的项目。

IP 地址池 Netnut

某些场景,你需要海量 IP 地址,以供切换,来抓取网络数据。这是一种特殊的服务,叫做"IP 地址池",提供全球 IP 地址。

今天就向大家介绍,一个新兴的 IP 地址池 Netnut,刚刚进入中国市场。

它有全球195个国家/地区的 IP 地址,分成四大类,供用户选择:

  • 动态住宅 IP
  • 静态住宅 IP
  • 手机 IP
  • 数据机房 IP

其中,单单住宅的动态 IP 地址,就有8500万个。按照官网介绍,这些地址稳定快速,不被屏蔽,而且便宜。

大家可以自己去看,它的价格是海外同类服务的一半,最低收费1美元,用法参见官方文档(英文)。

如果你正好需要 IP 地址池,可以试试 Netnut。点击链接注册,开通7天免费试用,跟客服说来自周刊,还有折扣。

科技动态

1、车灯过亮

一个加拿大消费者团体,正在要求各大车厂,降低车灯的亮度。

自从车灯变成 LED 灯以后,亮度大幅提高,足以让人炫目和不适。

而且,车灯过亮会刺激对向司机的眼睛,不利于交通安全。

问题是,消费者喜欢明亮的车灯,因为照得更远,可视范围更大。车厂不敢降低亮度,害怕影响销量。

2016年,奔驰汽车曾经做过一个广告,车灯照耀下,鹿的骨骼都清晰可见(上图)。现在的车灯就是亮到这种程度。

2、本周,特斯拉在好莱坞推出了第一家"特斯拉餐厅"。

他们的目标是,这种餐厅将成为特斯拉超级充电站的标配,让客户一边充电一边用餐。

客户可以进餐厅用餐,也可以不下车,等待店员送餐,并在停车场看露天电影。

该餐厅所有汉堡的纸盒,都是 CyberTruck 的纸模型。

3、2024 YR4 是一颗2024年发现的小行星,大小与喷气式客机相仿(下图)。

早先的估计是它有3%的概率,在2032年与地球相撞。最新的计算是,它不会与地球相撞,但有4%的概率,在2032年12月22日与月球相撞。

如果撞击点在月球朝向地球的那一面,将扬起1亿吨的月球物质,其中10%会来到地球。

虽然这对地球表面影响不大(大气层会烧毁大部分降落物),但对人类发射的卫星将有毁灭性影响。

4、日本大阪世博会,每天晚上有露天的无人机表演

表演结束后,无人机组成路标的形状,向观众指明出口的位置。

这真是好方法,大型露天活动可以用来向现场观众发布通知。

文章

1、绕过 Chrome 证书报错的口令(英文)

Chrome 浏览器遇到网站证书错误,会显示一个报错页面(上图)。

谁能想到,它居然有后门,只要输入口令thisisunsafe,就能跳过这个页面。

2、离职后,我的第一个出海产品上线了(中文)

作者一个人全职开发出海产品的故事。(@tahitimoon 投稿)

3、GPU 组网基础知识(英文)

AI 大模型需要成千上万的 GPU 连在一起,本文告诉你,这在技术上多么不容易。

4、CSS border-image 详解(英文)

本文详细介绍 CSS 的 border-image 属性,如何为边框设置背景图案。

5、Windows 任务管理器的四种替代品(英文)

Windows 进程如何管理?系统内置的任务管理器并不好用,本文介绍四种替代工具。

6、Tailwind CSS 的优缺点(英文)

本文详细分析了目前最流行的 CSS 框架 Tailwind CSS,它的长处并非没有代价。

7、粒子只有两类(英文)

物理学的科普文章,万物由已知的17种基本粒子组成。这些基本粒子可以分成两大类:玻色子(boson)和费米子(fermion)。

工具

1、RustScan

一个命令行工具,用来扫描发现某台服务器开放了哪些端口。

2、tsx

直接运行 TypeScript 代码的命令行工具,类似于 ts-node。

3、Colanode

团队协作软件,包括文档(类似 notion)和聊天(类似 slack)功能,使用 JS 语言编写。

4、OSS Rebuild

谷歌本周推出的一项服务,用来验证网上的 NPM、PyPI、Rust 的软件包,是否跟源码构建出来的完全一样,保证软件供应链安全。

5、vRain

制作中文古籍直排刻本的工具,使用 Perl 语言编写。(@shanleiguang 投稿)

6、OpenAPI-RS

一个 Rust 的 OpenAPI 库,可以解析 API 的规格文件,并进行数据验证。(@baerwang 投稿)

7、TrackWeight

把 MacBook 触摸板变成电子秤,使用时手指必须与触摸板保持接触。(@XueshiQiao 投稿)

8、se-script

作者写的一些 Bash 脚本,用于 Linux 系统管理。(@hvhghv 投稿)

9、订阅管理系统(Subscription Management System)

一个开源的 Web 应用,管理和追踪各种订阅服务的费用及续订,支持多币种。(@huhusmang 投稿)

10、WIMOOR

一个开源的跨境电商 ERP 管理系统,用来商品管理、订单处理、物流运输、财务结算等。(@bingodada893-boop 投稿)

AI 相关

1、怼怼侠

一个 AI 文字玩具网站,只需输入对方说的话,AI 自动生成优雅还击的句子。(@yuandongzhong 投稿)

2、Prompt Manager

VS Code/Cursor 的开源插件,统一管理 AI 提示词,支持分类、搜索、导入导出。(@yuki-node 投稿)

另有一个开源应用 Prompt Shelf,通过 Web 界面,对提示词进行版本管理,可以比对差异和回滚。(@newdee 投稿)

3、Dish AI Commit Gen

开源的 VS Code 插件,自动生成提交说明。(@littleCareless 投稿)

4、Lumma

一个基于 Flutter 的手机应用,通过跟 AI 问答和聊天,自动生成日记。(@geosmart 投稿)

资源

1、购房指北

这个网站将国家统计局每月发布的全国70个大中城市的房价指数,做成趋势图,便于查看趋势,代码开源。(@851235550 投稿)

2、手机博物馆

该网站对一些经典的诺基亚手机,进行了建模,可以 3D 查看,甚至可以开机,进入系统操作。(@hzh0292 投稿)

3、微软3号楼

想参观微软办公楼吗?这是微软西雅图总部3号楼的 3D 导览,可以进入每一层楼的每一条走廊。

这幢楼是早期办公楼,没有所有人共享办公空间的大平层,而是每个人都有自己的办公室。

4、CSS Exercises

一个 CSS 练习题仓库,分成初级、中级、高级,提供每道题的答案。(@Codeniu 投稿)

图片

1、欧元设计比赛

欧洲央行正在举办欧元纸钞设计比赛,邀请公众设计未来的欧元纸钞。

上图是目前网上最受欢迎的设计,图案是矿泉水瓶的瓶盖连着瓶身,这样不易遗失,防止造成环境污染。

2、手机的工业设计

下图是1992年到2014年的手机。

下图是2015年至今的手机。

手机的外观设计,大概已经定型了,不再有大的变化了。

文摘

1、氛围编程有点像老虎机

氛围编程(vibe coding)就是,你尝试输入一个完美的 AI 提示,梦想得到直接可用的、不必修改的代码。

这有点像老虎机,玩家充满了赌博心理,希望低投入、高产出,长期使用会成瘾。

AI 公司扮演的角色就是庄家,将 AI 工具货币化,鼓励用户不断使用,赚取利润。

刚开始,AI 公司会给用户一些免费积分,刚好完成90%的工作,但是剩下的10%是缺失的。用户忍不住一次次输入提示,进行优化,增加功能......

系统就会跳出提示:"对不起,免费套餐已经用完,请升级到付费会员"。这是不是很像庄家先给玩家一些免费筹码。

至于用户,就是以小博大的赌徒心理,心里想的是只投入几元或者几十元,就得到一个完美的程序,这个程序也许会值许多钱。

言论

1、

人们不应该互相发送文件副本。副本下载后就无法自动更新,也没有任何保护措施,谁都可以打开,而且永远无法撤销。

正确的做法是,不要把数据保存在自己电脑的某个文件中,也不要保存在云盘的文件夹。数据应该存在于数据库中,而不是 Excel 文件,然后针对每个人设置访问权限。

-- 《我们必须停止互相发送文件》

2、

如果人类文明崩溃,我计划用 U 盘装几个大模型,让它们在本地硬件上运行。这就像拥有一个精简的维基百科,我就可以借助 U 盘来重启文明社会。

-- 《如何在笔记本电脑运行大模型》

3、

假定 AI 每一步的正确率是95%,那么使用20步后,整个项目的正确率将只有36%。

-- 《为什么我不好看当前的 AI 智能体》

4、

我有个朋友,经常阅读中国研究人员撰写的英语论文。多年来,这些论文都很难读懂,往往有无法理解的句子。

突然间 AI 出现了,他收到的论文文笔优美,论证严谨,显然经过了 AI 改写。几十年来,美国一直拥有优势,因为英语是科学文献的主导语言,AI 一夜之间就摧毁了这种优势。

-- 美国 Los Alamos 国家实验室的工作人员

往年回顾

低利率与长期项目(#311)

黑客马拉松的正确方式(#261)

虚拟商品可以拉动 GDP(#211)

再见了,学术硕士(#161)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月25日
昨天以前阮一峰的网络日志

扣子空间网页设计,是在挑战 V0 吗?

作者 阮一峰
2025年7月24日 14:16

一、

扣子(coze.cn)大概是字节旗下最不好定义的产品。

它的定位是智能体(AI agent)平台,可以开发/运行各种 AI 应用。这意味着,AI 可以干的事情,它都能做。

但是,AI 一直在进化,所以扣子的形态也一直在变。

一开始,扣子是面向程序员的开发平台。它有工作流模式,在图形界面上拖拉节点,定义 AI 工作流,生成应用。

但是不久后,它又推出了"扣子空间",面向普通用户,使用自然语言,调用它内置的各种智能体。

我写过测评,把它当成办公助手,完成各种任务(PPT 生成、旅游地图规划、写研究报告等),完全是傻瓜式操作。

可是没有想到,昨天我发现,扣子空间加入了网页设计,又变成了 UI 工具,很像内置了一个 V0。

二、

V0 是最早的、也是目前最有名的网页设计/生成方面的 AI 工具。用户描述想要什么网站,它来实现。

这一次,扣子空间引入了这个功能,让自己又多了一种产品形态----网页设计工具。

现在,你完全可以在扣子里面,进行网页开发。而且,它是免费服务,并有安卓客户端(已发布)和 iOS 客户端(待发布),可以在手机上操作。

这听上去很吸引人。我试了一下,比如截图还原和网站生成,尤其是 Figma 设计稿的还原,看看它到底行不行。

下面就是我的试用体会。

三、截图还原

我首先测了截图还原,上传一张网页截图,让它把页面写出来。

扣子的网页设计功能,必须打开扣子空间的"网页"按钮。

我上传了 airbnb 的首页截图(下图),并输入"把这个截图还原成网页"。

系统提示,需要3到5分钟思考,代码在页面右侧滚动生成。

几分钟后,代码生成完毕,切换到预览页,下面就是它生成的页面。

这是第一次生成的结果,没有经过调整,我觉得还原度还可以,页面结构和每个区域都正确复刻出来了。

分享出来了,这个页面和整个 AI 对话,大家点击进去,可以看清晰效果。

值得一提的是,扣子生成的是 React + Tailwind 项目,可以整个下载到本地,用 npm 运行。这样的话,后期的手工处理比较方便。

四、Figma 设计稿还原

扣子空间的真正杀招是从 Figma 设计稿生成网页

具体做法是先在提示框,点击下方的 Figma 按钮。

网页会提示你,输入 Figma 链接。

这个链接怎么得到呢?在 Figma 网站的工作区,选中一个页面,打开右键菜单"复制粘贴/复制选区链接"(下图),就可以了。

我选了一个 Figma 官网的示例文件,把链接发到扣子空间。大家看看扣子的还原度

基本上,跟设计稿很接近,还原度非常高。所以,如果有设计稿原始文件,通过 AI 工具,完全可以替代手工开发。

这属于高级功能,国内其他 AI 工具,我好像没见过,在 V0 也是需要付费的。

五、可视化编辑

预览生成后,扣子空间提供了可视化编辑,修改起来相当方便。

先在预览界面,打开"编辑"按钮。

然后,选中页面元素,就会跳出 AI 对话框,你可以用自然语言编辑。

选中按钮后,我要求 AI 将按钮的背景色改成绿色(上图),提交后就会重新生成代码(下图)。

六、零基础生成网站

下面我直接用自然语言,跟 AI 描述需求,让它生成网站。

我让它生成一个待办事项(Todos)应用。

"生成一个蓝色主题的待办事项列表应用,并实现编辑功能,可以编辑列表任务。"

扣子空间就开始自动完成页面设计、代码编写、服务器部署,最后给出了下面的效果

这个页面还可以部署成可访问的链接,向外部用户公开。

我觉得,效果相当不错,各项操作(添加任务、编辑任务、删除任务)都没报错,一次生成就能运行,该有的按钮也都有。

这真的超出了我的预料,是不是扣子对常见任务做过特别训练?

理论上,网站生成不需要专业知识,零基础用户就能生成全站。实际操作也确实是这样,就算出现报错,也可以交给 AI 处理。但前提是只限于简单互动的网站,如果需要 JS 脚本处理复杂交互,就很可能出现 AI 解决不了的报错。

七、总结

上面就是初步的使用感受。

我感到,扣子空间的网页设计功能虽然刚上线,但是完成度很不错

它的三个重点功能----设计稿/截图还原、可视化编辑、网站生成----相当好用,生成质量完全可以接受,加上免费,我觉得很有竞争力。

它同样也有一些使用限制。

(1)没有命令行窗口。如果你不需要 UI,只让它生成后端代码,它没有提供命令行,无法测试。

(2)未集成 GitHub。它无法将代码直接跟 GitHub 同步,只能先下载到本地,再手动推送到 GitHub。

(3)不适合复杂的状态管理。它的强项是 UI 生成,不适合复杂的状态管理和交互逻辑。

总体上,这次更新让扣子空间变得更有用了,除了早先的聊天功能、办公功能,现在又增加了网页设计,实用性更强,常见的 UI 开发任务(生成网页和组件、完成原型设计),完全可以考虑用它。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月24日

《唐纵日记》摘录

作者 阮一峰
2025年7月22日 14:48

去年,我读了一本好书《唐纵日记》。当时做了很多摘录,今天整理出来。

一、唐纵其人

唐纵(1905--1981),湖南酃县(今株洲炎陵县)人,毕业于黄埔军校六期,蒋介石的心腹幕僚,军统头目戴笠的密友。

黄埔军校毕业后,他在国民党的情报部门工作,是特务机构的骨干。

1936年,他被派往德国,担任驻德使馆助理武官。回国后,进入蒋介石的秘书处"侍从室",成为第六组的组长,负责情报事务,每天选出重要情报并附上个人见解,向蒋介石呈报。

抗战胜利后,他担任过内政部政务次长、保密局副局长、警察总署署长。1949年去台湾,任国民党总裁办公室资料组组长、台湾省政府秘书长、国民党中央委员会秘书长等,1981年10月26日病逝于台北。

唐纵在大陆期间,有写日记的习惯,保持了20年没有间断。他的日记非常保密,连老婆都不让看。

1949年逃离大陆时,他来不及把日记带走,被解放军缴获。文化大革命后,大陆整理出版了他的日记(1936~1946)。

二、日记的风格

唐纵的日记不是长篇大论,他没有时间写,只是每天记录一些简单的片段,发表个人看法,直抒胸臆。

他几乎不谈个人生活,关于家庭的记录寥寥无几,主要记录的是时局、高层政治、外交、军事等,披露了很多内幕,参考价值很高。

因为没有打算给别人看,所以日记内容的可信度很高。

三、抗战时期的重庆

整个抗战期间,他大部分时间都呆在重庆,记录了一些重庆的社会状况。

百姓生活非常困难,物价飞涨,物质缺乏。

重庆市的批发物价指数,五金电料类已涨至战前24倍,衣料已涨至16倍,食料已涨至6倍,燃料已涨至15倍。(1940年12月10日)

近来物价飞涨,人心浮动,咸谓非惩办囤积居奇者,不足以平抑市价。闻重庆囤户甚多,委座下令缉捕。缉捕后为孔祥熙所保释。闻者无不叹气!(1940年8月7日)

日军虽然没有进攻重庆,但是经常派飞机轰炸,伤亡惨重。

昨日神仙洞一八零号公共防空洞被炸,一弹中门口,一弹中另一门口。天下有如此之巧事!计死亡一百七十七人,重伤一百六十七人,轻伤一百七十二人。因该处多全家遇难,故领恤者寥寥云。(1941年8月8日)

著名的大隧道惨案也有提到。

(日机)夜袭,隧道窒息,发生大惨局。(夜间)七时许入防空洞,至十二时始解除。

较场口隧道因人数过多,时间太久,而防护团不许人外出换气,将门倒锁,致发生窒息而死者数千人。

此次惨况,闻在八时即已发生。当时,防护团员以维持秩序,不许人民外出,致洞内人向外拥挤,以不得外出,均倒毙拥塞于洞口。死者难受,自将衣服撕毁,且有握发力拔,死后犹拔发在握。其状诚不可言。(1941年6月5日)

四、对蒋介石忠心耿耿

唐纵的一生忠于蒋介石,日记提到蒋介石的地方,都是正面评价。蒋介石也很重视重用他。

委座对我可谓相当重视,一周之内,三迁其位,我将如何努力以报答领袖知遇之隆也!(1939年5月17日)

唐纵认为,国民党存在的各种严重问题,都不是蒋介石的原因,而是底下的官僚地主集团太过腐败。

抗日三年,有钱者未尝减少,且因国难而膨胀其资财。中间层以薪水为生活之士大夫阶级,因物价之上涨而日见感受生活之痛苦,其思想感情,逐渐左倾,加以我政治之无能,腐化依旧,建树毫无,此在客观环境上,均于共党有利,如再过一年两年,纵敌军不深入夔门,社会亦将有巨大之变动!

思及此,终夜未成眠。欲上书痛陈,继思以委座之聪明才智,岂尚不知,以委座应变之长才,岂尚无策,吾人何必过虑。(1940年8月14日)

蒋介石对国民党的问题心知肚明,无奈客观条件制约,利益交错纵横,无力彻底改革。

时局已病入沉疴,决非局部更新可以奏效,必须领袖宸衷独断,下最大之决心,确立方针,调整组织,更新人事,始有回春之望!

张部长谓如何能使委座下此决心!余曰,忖度委座在目前,不愿多所更张,战后当有一番改革,然而并非彻底之改革!且其时机过迟,是否有效,颇为可虑!(1944年9月14日)

五、腐败的国民党

唐纵对国民党内部的腐败问题有清醒的认识。

全国公务员、教职员和大多数老百姓都生活不了,天灾人祸,物价高涨,大家都在死亡线上挣扎。此时强者铤而走险,弱者死于沟壑

政府事事要办而无一事办好,人力分散,财力分散,显得处处薄弱,处处危险。在职的公务员,个个忙乱,精力分散。在下的忙于柴米油盐,在上的忙于妻财子禄,精力另有所托,另有所耗,对公事敷衍塞责,任何问题,不能解决。(1946年5月17日)

他对此深恶痛绝,却也无力回天,只有叹息。

几个意见,均蒙领袖采纳,但是交下实施时,便无下落。自己坐在侍从室,眼见如此,真是有些心痛。(1938年10月6日)

现在还在资本家官僚者把持得势之时,凡是违背他们利益时,任何主张意见,均无法实施。故虽委座苦口婆心,痛哭流涕,终无效力。(1941年1月7日)

现在官场中,自己不做事,又不愿旁人做,误事误国,言之慨然。如此政治非革命不可,但从何处下手是好,滔滔者天下皆是,就是撒手不问,也无可以生存之处,贪污的大的无人敢过问,小的做了替死鬼。(1941年9月9日)

走私经商的不是党政机关就是军队,而纯粹商人走私经商已不容易了。今日犯科作奸的都是有力量的人,政治的败坏,自上而下,所有经济政治军事全都坏了,欲图挽救还是须要自上而下。如果不能彻底有所改革,社会真是不可收拾。(1944年6月29日)

本党在此次会议中完全表现为一保守性之政党而非革命性之政党。查其原因,国民党党员大部分为公务人员,此种党员在十余年来一党专政的长时期中,地位提高了,财产增大了,生活优裕了,大家希望保持其原有生活与地位,故不希望改革,以动摇其自己之地位。(1945年5月31日)

本党政治的腐化不但引起党外的反感,亦且失了党内的同情,如果没有显著的改革,全国人心将不可收拾。(1945年6月30日)

抗战期间,国民党政府和军队的萎靡状态,简直难以想象。

上午委座召集部长以下、科长以上职员训话,大骂人心披靡,精神不振,禁止以后不许嫖、赌、跳舞,在茶楼酒馆挥霍游荡,如有发觉,定予严惩。(1938年12月18日)

现在士兵日不能饱,时思逃跑,官长,则时以防止士兵逃跑为急务,因不如此,则其赔偿损失将不堪负累矣。带兵且如此困难万分,遑论练兵,既不训练,何能作战?故每战辙北,非无因也,一叹!(1940年9月20日)

有人谓前方吃紧,后方紧吃,前方有什吃什,后方吃什有什。前方一身流血,后方满口流油。(1941年3月31日)

上级干部在追求权位,下级同志在追求生活。主义、政治、革命,都已忘却了,消失了!(1943年4月28日)

唐纵认为,国民党无力改革的根本原因,在于它是一个地主阶级政党,首先保卫自己的利益,而不是全民的利益。

救国必先救党,党不健全,便无法领导政治走上轨道,如何才能健全党呢?必须清理党的成分。据统计,目前青年团团员,百分之八十五是公务员,国民党的党员大都是地主资本家小资产阶级,与三民主义的精神正相反,何能望其执行三民主义之政策。(1940年11月8日)

六、对共产党的看法

唐纵对共产党的看法也很清醒,认为国民党的腐败导致了共产党的兴起。

许多地方治安不好,一有乱子,便归咎中共的煽动,其实以现在政治经济情形,没有中共也要出乱子。在民国以前没有共产党,历史上常常有农民暴动的事发生。把所有变乱的原因都归结于共产党的煽动,这是自己逃避责任。(1941年4月24日)

广东东江之米,达四千多元一石,人民生计,艰苦达于极点,都是为共产党造机会。(1944年5月6日)

七、为人处世的经验

他的日记里面,还有很多官场观察和感叹。

历史上刚直孤僻者,未有不失败。官场亨通的人多半是圆滑,江洲上的石头没有一个是方峭的,方的都给水荡平了。山峰也是圆的,方的终会给风雨削平了。树木的干儿,也都是圆的,这是适者生存的道理。人类也不能逃出这个例子。历史上有能用刚直孤僻的人,是最成功的,但是刚直孤僻的人就不容易遇着这长官的。(1944年5月29日)

他还有一篇最有趣的日记,对官场的生存之道进行了长篇总结。

一、品格高尚者为人赞扬,但攫权得势者多为小有才智,恭顺权贵,为权贵所赏识提携。

二、学识渊博者为人称道,但踞高位者,多为善权术长机智,应变有方,处事圆滑之人。

三、对上要善承意旨,不可自作主张,上之所欲者集全力为之,上之所恶者竭力避免,是非曲直不必计及,信任第一,是非其次。

四、对同僚,应酬可以换取同情,同情即是友谊的保障,一切过失误会,皆可消释。

五、对下属操纵在手牵制得法,苛刻严峻,反为当权者得意之作,宽恕仅为儒生之谈助。

六、初起时必须利用机会,假借名义,自抬身价,大吹法螺,便可幸进,埋头苦干者未必得直。

七、及在位,多做事多烦恼,不做事大家好,一年不倒,资格到手,二年不倒,官位稳固。

八、洁身自好,是个好人,好人是个空名誉,忠厚老实是无用之别名,老实人只能粗茶淡饭,莫想乘肥马衣轻裘,妄想必多灾难,倒不如安分下场。(1942年8月)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月22日

科技爱好者周刊(第 357 期):稳定币的博弈

作者 阮一峰
2025年7月18日 07:59

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

西安连续第二年,开放防空洞改建的市民"纳凉中心",里面提供桌椅,还有 Wifi、电视、饮水机等便利设施。(via

稳定币的博弈

稳定币(stable coin)是最近的热点,新闻媒体不断提及。

起因是今年5月,香港通过了《稳定币条例》,8月1日马上就要生效,允许企业申请牌照、发行稳定币。

可以想象,香港有了稳定币,对于大家来说,就多一个金融机会和金融工具

但是,大多数人并不清楚,稳定币是什么?有什么用?

我就来谈谈看法,为什么香港发行稳定币意义很大,其实很好懂。

(一)

稳定币属于加密货币的一种。它的由来跟比特币有关。

比特币是最早的加密货币,价格波动十分剧烈。今天值5个烧饼,明天可能值8个,后天又变成4个。

这注定了,它不适合作为交易工具,你根本不会用它来买卖其他东西。

于是,人们想到可以创造一种价格稳定的加密货币,也就是稳定币。以目前最大的稳定币 USDT 为例,它是 Tether 公司在2014年开始发行的(比特币是2009年诞生的)。

Tether 承诺,USDT 的价格保持不变,始终为1美元。你给 Tether 公司1美元,就可以得到1枚 USDT(不是实物,而是记录在区块链账本上)。等你不需要了,就把 USDT 再卖给 Tether 公司,拿回1美元。

理论上,只要 Tether 始终保留足够的美元储备,那么稳定币与美元的比价就能维持在1:1。Tether 公开了自己的财务,绝大部分收到的美元都购买了美国国债,所以大家觉得它的承诺是可信。

一旦人们认可,稳定币等价于美元,那么凡是可以使用美元的地方,都可以使用稳定币,你就可以用稳定币购买各种各样东西。

现在,USDT 是世界上交易量最大的加密货币,超过了比特币。大部分情况下,它被用来买卖其他加密货币。

(二)

使用稳定币时,人们发现,它可以逃避美国政府的监管

稳定币的流动完全脱离银行体系,是匿名钱包之间的交易,根本没办法追踪和监管。

举例来说,美国政府某一天突然发布命令,禁止张三使用美元。这种情况下,张三改用稳定币,向李四购买想要的东西,李四再将稳定币兑换成美元。

美国政府完全不会察觉,发生了这样一笔交易。即使政府监控美元的兑换,由于稳定币还可以兑换成其他加密货币,追踪是不可能的。

美国政府也意识到了这个问题,于是本周正在通过一个《GENIUS 法案》,它是历史上第一个稳定币的全面监管法案。

这个法案的主要内容有三条。

  1. (美元)稳定币的发行机构,必须在美国管辖范围内,且获得政府许可。
  2. 发行机构所得的美元必须 1:1 转成银行存款。
  3. 美国政府有权阻止、冻结、销毁外国机构发行的(美元)稳定币。

(三)

香港政府这次通过的《稳定币比例》,实在是很妙的一招。它允许持牌机构发行港币支持的稳定币。

大家知道,港币跟美元汇率是不变的,7.8港币等于1美元,因此港币稳定币与美元稳定币的汇率也是不变的。

所以,港币稳定币可以替代美元稳定币,进而间接替代美元。这里最重要的一点是,港币稳定币的发行和使用,都不受美国控制。

也就是说,香港创造出了一种价值跟美元挂钩,但可以逃避美国监管的金融工具。可以设想,如果某些情况下,国际贸易无法用美元结算,也许就可以用港币稳定币结算。

(四)

最后一个问题,人民币稳定币可能出现吗?

就像上面说的,稳定币很难监管,且可以自由兑换成美元,所以我认为,跟人民币挂钩的稳定币应该不会出现。

科技动态

1、美国租车巨头 Hertz 公司,引入了汽车扫描仪

还车的时候,扫描仪使用摄像头,对车身拍摄数千张高分辨率图像,与提车时进行比较。如果发现新增的凹痕和损伤,就会要求赔偿。

这对租车公司不仅高效,而且因为有电脑的照片比对,减少了争议。投入使用后,罚款金额比使用前增长6倍。

2、合肥某家海底捞门店,服务员佩戴二维码胸牌上菜。

据说,这样便于顾客向服务员打赏。有人认为,这是变相索要小费。媒体报道后,店家取消了二维码胸牌。

我觉得,不仅不应该取消,还应该在服务业推广,只是名称要改成"员工码",除了打赏,还可以用来投诉。

3、加拿大出现了一件啼笑皆非的事情。一支名为 Velvet Sundown 的乐队,突然横空出世,进入 Spotify 的热门播放榜。

没人知道他们从何而来,没有照片,没有介绍,查不到个人资料。人们猜测他们是 AI 生成的。

面对质疑,乐队始终保持沉默。突然有一天,一个男子在网上自称是该乐队的发言人,宣称乐队是真人,并发布了照片。

这些照片一看就是 AI 生成的,反而做实了质疑。照片广泛传播后,乐队终于坐不住了,发表声明:所谓发言人是假的,照片是粉丝恶搞的,但承认音乐确实是 AI 生成的。

讽刺的是,经过媒体曝光,乐队知名度大大提高,播放量继续攀升。真正的音乐家看到如此闹剧,都要吐血了,真人音乐完全没搞头了。

4、谷歌安卓团队负责人 Sameer Samat,主动透露 ChromeOS 将与安卓合并

安卓的目标是,将手机、平板与笔记本打造成统一平台。以后会有安卓笔记本,可以直接运行手机应用。

5、上周,X 公司发布 Grok 4 模型。用户震惊地发现,如果向它询问当前时事,它会先查看马斯克的立场(下图)。

据推测,这应该不是故意设计的。而是,作为 X 公司的产品,Grok 会查看该平台用户的想法。它知道马斯克是 X 公司的老板,就先去查看他。

最搞笑的还在后面,因为这件事影响太坏,Grok 4 公开修改了系统提示,明确要求模型不要参考埃隆·马斯克的发言。

文章

1、Django 框架的起源(英文)

本周是 Django 框架的20周年纪念日,创始人 Simon Willison 回忆发明过程,很多有趣的细节,比如他最早只是想用 Python 替换掉 PHP 4。

2、树莓派安装 PiKVM 教程(英文)

登录一台远程计算机,控制它的桌面,一个简单的方法就是使用 KVM 设备。本文演示如何在树莓派上安装 PiKVM

3、Elm 语言的现状(英文)

Elm 是一种 Web 开发语言,非常有特色,但是从2019年至今没有新版本。本文指出 Elm 没有死亡,而是一直在发展,社区非常活跃。

4、CSS 的 if() 函数(英文)

Chrome 浏览器的137版本,开始支持 CSS 的条件语句---- if() 函数。CSS 越来越像编程语言了。

5、如何添加 Git 子命令(中文)

本文教你怎么手动增加一个git branch.note命令。(@shangwenhe 投稿)

6、避免 continue 语句(英文)

本文提出循环结构的 continue 语句根本不必要,让阅读代码变得不流畅,你不应该使用这条语句。

工具

1、Anytype

开源的多平台笔记软件,Obsidian 的替代品,自带点对点的同步功能。

2、Pangolin

一个带有 Web 界面的反向代理服务器,用于从公网访问内网服务,开源的 Cloudflare Tunnerl 替代品。

3、Upyo

一个 JS 库,提供 email 收发的所有功能。

4、OpenCut

开源的视频编辑软件,目标是成为剪映的替代品,目前只有 Web 版。

5、Toodoo

户外轨迹导航的苹果设备应用,支持离线地图、等高线和 3D 卫星地图导航,可以生成运动轨迹视频,手机端完全免费。(@haozes 投稿)

6、TcpViz

这个网站用来对 pcap 网络包文件进行可视化分析,一键生成分析报告。(@jlingjace 投稿)

7、WebCurl

网页版 API 调试工具,Postman 的简易替代品,前端只有一个 HTML 文件。(@o8oo8o 投稿)

8、HubProxy

基于 Go 语言的自托管应用,提供 Docker 和 GitHub 的加速服务。(@sky22333 投稿)

9、配置文件管理器

一个跨平台桌面应用,用来编辑本地和远程的各种配置文件,可以在编辑后,一键保存并重启对应的服务。(@HeroIsUseless 投稿)

另有一个 macOS 的配置文件编辑器 Configs,它会自动扫描发现本地的配置文件。(@iHongRen 投稿)

10、MeetSpot

一个开源的 Web 地图应用,用户输入多个参与者的出发位置,它会推荐对大家距离合适的聚会场所(如咖啡馆、餐厅、图书馆等)。(@JasonRobertDestiny 投稿)

11、好享记账

开源的记账应用,链接是 Flutter 前端仓库,另有后端的 Java 仓库。(@suyu610 投稿)

AI 相关

1、EPUB Translator

一个使用 AI 模型,对 epub 电子书进行双语翻译的 Python 库。(@BlackHole1 投稿)

2、PoPo

一个很有意思的开源应用,使用自然语言发出指令("弯腰"、"大笑"等等),控制网页上的 3D 模型人,在线试用。(@AmyangXYZ 投稿)

资源

1、Kite

搜索引擎公司 Kagi 推出的一个新闻网站,完全由 AI 驱动:AI 选择新闻,提炼出摘要,并翻译成用户指定的语言。

2、x86-64 汇编语言入门(英文)

面向初学者的汇编语言教程,从内存和寄存器讲起,标题链接是第一讲,后面还有第讲。

3、HTTP 状态码详解(英文)

一组系列文章,逐一详细解释68个官方的 HTTP 状态码。

图片

1、iPhone 拍摄的电影

美国最近上映的僵尸电影《28年后》(28 years later),是用 iPhone 15 Pro Max 拍的。

上图是20个 iPhone 一起拍出多视角镜头。

导演选择 iPhone 来拍摄,是因为想做不一样的尝试,手机很便携,还可以绑在演员身上拍。

为了拍出最好的效果,拍摄时还会使用很多辅助设备,主要是专业镜头和稳定器。

2、乐高人体解剖玩偶

一位美国艺术家将乐高玩偶,改造成人体解剖积木。

下面是正常的乐高人偶。

下面是改造后的人体解剖人偶。

经过这样的改造,普通的玩偶顿时变成了艺术品。

文摘

1、数量胜于质量

学期开始时,佛罗里达大学摄影课的教授,将学生分成两组。

一组是数量组,按照作业的数量评分;另一组是质量组,按照作业的质量评分。

数量组拍出100张合格照片为 A,90张为 B,80张为 C。

质量组只需要提交一张完美的照片,评分就基于这张照片。

如果你是摄影课的学生,你会选择哪一组?

学期结束时,教授发现,所有最佳照片都来自数量组。

数量组必须多拍,所以学生慢慢习惯了接受摄影的不完美,从一次次的实践之中,开始精通摄影,最终从许多次不完美的拍摄之中,诞生出一张完美的照片。

想想看,100次拍摄意味着什么:100次与光的对话、100次构图实验、100次的反思机会去检讨意图与结果之间的差距,然后进行调整。

相反的,质量组不得不苦苦学习理论,搞清楚如何拍出一张完美的照片,先掌握理想的构图,再探索最佳的技巧。他们因此积累了丰富的摄影知识,却没有培养出那种只有反复按下快门才能获得的直觉。

这就好比,质量组是地图专家,而数量组是探险家。学期结束时,质量组可以告诉你为什么某一张照片很棒,而数量组拍出了这样的照片。

言论

1、

我真的不明白 Cursor 这样的 AI 工具,本身有什么价值。它就是一些 API 的包装器,对吧?

据我所知,世界上真正的 AI 公司大概只有四家,其他公司都是在贴牌。

-- Hacker News 读者

2、

大型科技公司付出天价薪水给 AI 人才。公司是这样想的,AI 将是一个超过10万亿美元营收的机会,而 AI 研究人员人数上限只有几百人,那么每位研究人员每年薪水500万美元、1000万美元或2000万美元能有多大差别?

要知道,就算每年向 AI 研究人员支付100亿美元的薪酬,这点钱还不到 Meta 年度资本支出的四分之一。

-- 《AI 人才争夺战》

3、

AI 就是一种新型的操作系统,帮你完成各种任务。这个系统的 CPU 就是大模型,内存就是模型的上下文窗口,窗口越大能完成的任务规模就越大。

-- Andrej Karpathy,著名 AI 科学家

4、

这个世界有两种人:一种人用电脑来工作,另一种人看到电脑,会忘了工作,一心先摆弄电脑,把能改的都改完,直到完全顺手为止。

-- 《Framework 13 评测》

往年回顾

内容农场的 AI 赚钱术(#310)

你的旅程不会停在 Day 1(#260)

为什么软件变得复杂(#210)

中年码农的困境(#160)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月18日

科技爱好者周刊(第 356 期):公司强推 AI 编程,我该怎么办

作者 阮一峰
2025年7月11日 08:00

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

6月24日,深圳开展消防演习,无人机喷水,进行高层建筑灭火。(via

公司强推 AI 编程,我该怎么办

前两天,"黑客新闻"论坛有一个求助帖

程序员求助,公司强制使用 AI 编程,他不想用,怎么办。

下面七嘴八舌,大家说了很多想法。这是现在的热点问题,我今天就来分享这个帖子。

2025年的现实就是,AI 编程(AI coding)已经从实验室技术变为成熟技术,无法回避了。

它自动写代码,成本低、产出快,公司管理层不可能不推广。程序员就很尴尬了,跟 AI 是合作竞争关系,既要用好 AI,又要防止岗位被它抢走。

求助帖这样写道:

我是一个高级工程师,已经在公司工作五年了。公司越来越推崇快速工程,CEO 和 CTO 都对 AI 编程痴迷不已。

公司强制大家使用 AI 编程,甚至提倡让 AI 生成单元测试,对于失败的测试用例,也是扔给 AI 处理,而不是手动解决,以加快开发速度、产品尽早上线。

我考虑辞职,不想参与这种流程,成为不写代码、只写提示的"提示工程师",眼睁睁看着自己的技术停滞或退化。我也不想两三年后,负责维护一堆由 AI 生成的意大利面条代码。

我想听听大家的意见,怎么应对公司推行 AI 编程。

网友的看法,总结起来就是三种选择,都有一定的道理。换成你,会怎么选择?

选择一:听从内心

如果你确实精疲力竭,那就离开吧。即使你还能忍,做一份自己讨厌的工作,也很快会精疲力竭。

最糟糕的情况是,你平时在公司里,表面上假装对 AI 充满热情,但心里又不愿意,那真的是煎熬。

放任自流的 AI 编程会快速积累技术债,最终导致项目失败。公司迟早会要求你,修复 AI 造成的代码混乱,如果你回答唯一解决方法就是大规模的手动重写,可能还是会被解雇。

而且,你们的 CEO 和 CTO 看上去盲目信任 AI,公司的前途堪忧。

已经有一些公司明确声明,现阶段不打算将 AI 编程用于线上代码,你可以试试找这样的公司。

不过,如果没有足够的积蓄,你还需要再忍几个月,一边攒钱,一边找工作,并学习一些 AI 不容易取代的复杂枯燥的技术。记住,除非你是超级技术明星或非常富有,否则不要在找到新工作之前就辞职。

选择二:接受现实

你去其他公司也一样,现在到处都在使用 AI 编程。有些公司实际上通过采用 AI,来清除那些"拒绝改变"的人。

我认为,我们永远不会再走回头路了,你用过就知道回不去了。下一代程序员都会在 AI 的陪伴下成长。你不愿意使用 AI,就好比不愿意用电脑替代打字机。AI 编程的普及,只是时间迟早的问题,不接受它的人都会被淘汰。

再说,反正是公司付钱,让你学习使用 AI。聪明点,留下来接受这笔交易。

现在的市场是雇佣者市场,有的是人愿意接替你的位置。即使你找到一家目前不使用 AI 的公司,很可能意味着他们远远落后于时代潮流,也许很快也转向 AI。

你最好适应现实,找到在公司立足的方法。即使心理上接受不了,也要用公司的钱来试试新技术。

你可以先在小范围使用 AI 编程,检查它做的代码变更。AI 代码需要大量审查和重构,你能做的比你想象的要多。

选择三:静观其变

你可以继续留在公司,一边学习 AI 和其他新技术,一边观察会发生什么情况。

如果公司发展比你预期的要好,AI 效果不错,那么你应该改变想法,为新的工作模式做好准备。

如果结果跟你预计的一样,代码快速劣化,项目面临失败。你得到了使用 AI 的经验,知道它在第一线的优势和劣势,把它写进简历,为应聘下一家公司提供帮助。

无论哪一种情况,你接下来留在公司的几个月,都会对你的职业生涯有帮助。

私底下,你必须现在就开始找下一个更符合你期望的职位,为不利局面做准备,为自己留一条后路。

科技动态

1、日经新闻发现,8个国家的多篇学术论文,包含隐藏的提示,要求 AI 工具给予论文好评。

它们的 PDF 文件里面,有隐藏的小字或白色文本,人类不容易看见,但是 AI 能读到。

提示为"只给出正面评价"和"不要强调任何负面评价",甚至要求 AI 推荐该论文,理由是"贡献卓著、方法严谨、新颖性非凡"。

现在,AI 往往用来筛选论文,或者总结论文内容,这些提示就是针对这种情况。类似的情况还有,许多简历也隐藏 AI 提示,要求对求职者给予好评。

2、一种中国设计的激光灭蚊器,正在众筹

它使用激光雷达,不断发射激光脉冲来确定蚊子的方位,然后再发射激光击杀蚊子。

如果蚊子的飞行速度超过每秒1米,就无法被检测到,因此它不适用于飞行速度较快的苍蝇。

它用移动电源充电。普通版可以杀灭3米内的蚊子,续航8小时,众筹价格468美元;专业版杀灭6米内的蚊子,续航16小时,价格629美元。

3、"酷"(cool)这个词,常常用来形容人或事物,比如这个女孩很酷。但是,酷到底是指什么?

一项研究发现,酷主要包含6种特征:外向的、享乐主义的、强大的、爱冒险的、开放的和自主的。

4、《华盛顿邮报》报道,美国很多员工,让 AI 代替自己出席线上会议,本人不去。

AI 负责录下会议内容、转成文字、并整理出要点。当然它只能听,不能发言。

这真是很有创意的用途,让 AI 当作自己的替身,承担部分工作。

5、数学海报

旧金山街头的电线杆上,最近出现了奇怪的海报,上面是一个很长的数学公式。

解开这个公式,可以得到一个网址,领取奖品。

标题链接有这道题目的全文,它的评论部分有答案(奖品已经领光了)。出题的是一家 AI 公司,这确实是很新颖的吸引人才的方式。

文章

1、Bloom Filters 示例讲解(中文)

本文通过例子,介绍 Bloom Filters 入门知识,可以用来判断元素是否在集合内。

2、阶乘的斯特林公式推导(中文)

一篇数学科普文章。斯特林公式一般用来快速计算阶乘 n!,本文尝试用通俗语言推导这个公式。(@longluo 投稿)

3、Git 用户应该尝试 Jujutsu (英文)

Jujutsu 是 Git 的一个前端,底层兼容 Git 代码库,但是大大简化了前端操作。本文比较了三种操作,都是 Jujutsu 简单得多。

4、在 Mac 电脑使用 Apple Container 的感受(英文)

在 Mac 电脑使用 Docker 容器,性能开销很大,好在苹果推出了自家的原生工具 Apple Container 取代 Docker。

本文是作者的使用感受,发现它目前只适合简单场景。

5、如何判断是否在线?(英文)

通过向某些特定网址发送 HTTP 请求(比如google.com/generate_204),根据它们的回复,判断当前是否在线。

6、点赞泄漏的个人信息(英文)

作者将过去7年中、自己点赞保存的近900篇文章,输入 o3 模型,让模型分析自己是怎样一个人。

结果令他大吃一惊,模型给出了2000多字的分析,准确说出了他的个人情况。

7、从 DNS 查询国际空间站的位置(英文)

本文介绍 DNS 的一个妙用,它可以提供 LOC 记录,表示服务器的经纬度。作者就用这个记录,来提供国际空间站的当前位置。

工具

1、giscus

一个基于 GitHub Discussion 的静态网站评论系统。

2、phpIPAM

这个工具通过 Web 界面,查看/管理局域网设备的 IP 地址,参见介绍文章

3、NumPad

一个在线的网络笔记本,特点是可以进行数学计算,输入1 + 1,它自动输出答案2

4、LiteOps

一个自搭建的轻量级 DevOps 平台,用来管理 CI/CD 操作。(@hukdoesn 投稿)

5、Ech0

一个开源的个人微博平台,查看 demo。(@lin-snow 投稿)

5、PageTemplatify

静态 HTML 页面生成工具,内置各类模版,适合快速测试或展示网页。(@luhuadong 投稿)

6、REM

基于 Rclone 的跨平台桌面 App,在一个窗口管理各种云存储的文件,实现文件互传。(@surunzi 投稿)

7、OnlyOffice Web

这个项目把 OnlyOffice 转成了 WASM 文件,不需要服务器,浏览器纯前端就能查看/编辑 Word、Excel、PowerPoint 文档,在线试用。(@chaxus 投稿)

8、在线拼图工具

免费的在线工具,多张图片拼成一张大图。(@ops-coffee 投稿)

9、Portfolio

一个基于 Docusaurus 的个人静态网站的模版,查看效果

10、Postcard

一个自搭建的个人网站+新闻邮件服务,参见作者的产品介绍

AI 相关

1、OpenCode

一个 AI 终端客户端,可以在命令行向大模型发出指令,操作文件等,类似于 Claude Code,但是开源且不限定大模型种类。

2、Simple Chromium AI

Chrome 浏览器从138版后,内置了 Gemini Nano 模型,并提供 AI Prompt API 以便调用。

这个库就是浏览器 AI Prompt API 的封装,用起来更方便。

3、TouchFS

一个很有创意的 AI 命令行工具,用它加载目录后,直接输入文件名,就能自动生成想要的文件。比如,输入touch README.md,就会自动生成自述文件。

4、yutu

YouTube 的非官方 MCP 服务器,AI 智能体接入后,就能用自然语言操作 YouTube。(@OpenWaygate 投稿)

5、Pointer

一个 AI 聊天的桌面客户端,可以使用文件夹管理聊天记录,支持全文搜索和交叉表分析。(@experdot 投稿)

6、TTS Omni

免费的文本转语音网站,基于 Qwen-TTS。(@CurioChen77 投稿)

资源

1、气温地图

这张地图可以查看全球当前的天气数据。(@Codeniu 投稿)

2、n8n 工作流导航

n8n 是一个工作流自动化编排软件,这个网站收集已经编排好的 n8n 工作流,目前共有近2000个。(@panyanyany 投稿)

另有一篇教程文章,通过 n8n 工作流,将网址保存进 Notion 数据库。

3、4 colors

这个网站提出,页面设计只需要4种颜色:前景色、背景色、强调色和趣味色。你可以在该网站生成这四种颜色的调色板。

图片

1、魔方板凳

国外设计师制作的"魔方板凳"。

板凳就是一个魔方,必须解开魔方,才能坐上去。

实际上,只要把四条腿转到同一个面,就能坐了。

2、中国最大的书

中国最大最厚的书,是清朝的玉牒,一册厚达85厘米,重约90公斤。

它是皇家的族谱,记载的皇族宗室男性就有10余万人,由宗人府负责编撰,目前收藏于北京的中国第一历史档案馆。

文摘

1、计算机好比自行车

摘自斯蒂夫·乔布斯1980年的访谈。

我记得,大概12岁的时候,读过一篇文章,应该是在《科学美国人》杂志。

那篇文章给出了地球上所有物种的运动效率,从 A 点到 B 点,同样的距离,它们消耗了多少能量。

结果,秃鹫位居榜首,运动效率最高,超越了其他所有生物。人类排在榜单的最后三分之一,对于"万物之王",这个成绩实在不值一提。

但是,作者很有想象力,测试了人类骑自行车的效率,结果远远超过了秃鹫,荣登榜首。

这给我留下了深刻的印象。我们人类是工具制造者。我们可以制造工具,将自己的能力放大到惊人的程度。

对我来说,计算机就是思维的自行车。它能让我们超越自身的能力。

我认为,我们才刚刚处于计算机的早期阶段----非常早期的阶段----我们只走了很短的一段路,计算机仍在发展中,但我们已经看到了巨大的变化。

我认为现在与未来一百年即将发生的事情相比,根本不算什么。

言论

1、

长久以来,你努力培养技能,成为一个程序员,编程已经成为你的身份认同的一部分,是你人生价值的来源。突然之间,AI 取代了你的技能,让你的人生价值消失,许多人因此抵制 AI。

-- 《当 AI 可以编程,我还剩下什么?》

2、

洛杉矶的问题是太大,太分散,公共交通很少,必须开车。但是,这使得你根本遇不到有意思的人,他们都被困在车里。

-- Hacker News 读者

3、

AI 不缺乏知识,它的问题是不会怀疑现有知识。

要让 AI 变成爱因斯坦,仅仅让它无所不知是不够的,更需要让它能够提出别人未曾想到或不敢问的问题。

-- 托马斯·沃尔夫(Thomas Wolf),Hugging Face 联合创始人

4、

《纽约时报》报道,雇主正被大量 AI 生成的简历淹没,根据求职网站统计,今年的简历比去年激增45%。

AI 可能会让简历消亡,AI 生成的简历已经无法鉴别一个人了。未来的招聘应该采用 AI 无法介入的方式,比如现场解决问题。

-- 《AI 让简历消亡》

5、

如果你把爱好当成职业,想以此养活自己,一段时间后,最初的兴奋消退了,你就会发现,开始阶段根本不算什么,真正的困难在后面,无数繁琐和重复的工作正等着你。

这个时刻被称为"放弃点"(quitting point),很多人会在这个时点选择放弃。

每个人的放弃点不一样,但都会到来。作家的放弃点,也许是小说写到第30页,最初的灵感枯竭,不知道怎么写下去。创业者的放弃点,也许是最初的几个月之后,市场的反应不像朋友和家人那样热烈。艺术家的放弃点,也许是作品第一次上架后,意识到自己的愿景与能力之间存在巨大差距。

-- 《眼光过高是一种自我破坏》

往年回顾

无人驾驶出租车的双面刃(#309)

如何免费使用 ChatGPT(#259)

程序员是怎样的人(#209)

游戏开发者的年薪(#159)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月11日

科技爱好者周刊(第 355 期):两本《芯片战争》

作者 阮一峰
2025年7月4日 08:02

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

重庆某消防站,改造成赛博朋克风格,霓虹灯都是一些防火标语。网上走红以后,该装饰现已被拆。(via

两本《芯片战争》

前些日子,我想找芯片知识的书籍,想起有一本很有名的畅销书,叫做《芯片战争》。

搜索发现,《芯片战争》居然不止一本,而有两本书都叫这个名字。

《芯片战争》,余盛(华中科技大学出版社,2022)

《芯片战争》,[美]克里斯·米勒(浙江人民出版社,2023)

一本是中国人写的,另一本是美国人写的。我都读了,下面就是简单的读后感。

为了便于区分,我把中国人写的那本称为"国人版",美国人那本称为"老美版"。

这两本书的内容,都是芯片行业的发展史。读完以后,我的最大感受是,它们可以帮你了解芯片历史,但是帮不了你了解芯片知识

因为它们不是科普图书,更不是技术图书,而是经管图书。

我有点后悔,没查一下作者背景。读了才发现,这两个作者,都不是芯片行业人士,甚至不是科技从业者。

国人版的作者是会计系毕业,后来在食品公司工作,他的上一本书写的是粮油贸易。

老美版的作者是政治系毕业,现在是大学教授,专门研究地缘政治,上一本书写的是俄罗斯历史。

可想而知,这样的作者写芯片行业,不会有深入浅出的技术分析,只会关注商业经营层面。

事实上,国人版的内容,不客气地说,全部都是从新闻报道搜集整理而来,编辑成一个个故事,完全是商战书籍。

老美版相对好一些,作者采访了一些当事人,有第一手资料,内容条理比较清楚,更像一本商业历史书。

虽然我对缺乏技术讲解挺失望的,但是我认为,这两本书还是能带给读者收获

很多内容我以前就知道,比如晶体管是怎么来的、集成电路的发明人之争,但还有不少事情是这次读了才知道。

国人版有一个专门的部分,介绍中国芯片发展史,收集了很多相关材料,我还没在其他地方见过,比如江上舟的故事、张汝京的故事、汉芯造假事件、从武汉新芯到长江存储等等,内容详细,带给人很多冲击。

老美版的优点,前面说了,有第一手材料,站得比较高,按照编年史顺序,以人物故事的形式,理清了行业的发展脉络。虽然作者的专业是政治学,但总体上没有加入政治观点,写得比较中性客观。

另外,老美版偶尔会有一些技术概念的通俗讲解,写得挺好。我摘录了一段芯片的种类介绍,放在后面的文摘部分,大家可以看看。

我的结论就是,如果你单纯想了解芯片行业的基本历史,可以读老美版;如果还想了解国内芯片行业的历史,可以读国人版。

科技动态

1、苹果的"液态玻璃"设计,曾经将 macOS 文件浏览器 Finder 的图标左右反转。

网友质疑后,苹果在下一个测试版又改回来了。

上图左边是原来的图标,中间是第一个测试版,右边是第二个测试版。

最新图标依然采用玻璃材质,看起来感觉还不错。

2、一个比利时工程师写了一个程序,让 AR 眼镜实时识别路边广告

一旦发现广告区域,就在其上覆盖一个红色遮盖层,相当于视觉屏蔽广告。

这是我看到的最有创意的 AR 用法。

3、媒体报道,一个41岁的深圳程序员不租房,在车里住了3年。

他老家在300公里外的广东阳江,周末开车回去看妻子孩子,平时睡在车里。

他说,以前在出租屋住,一个月要2500元,很小的单间,环境非常差。现在,"车上开着空调,很舒服的"。

停车一晚是6元,平时洗漱在公园卫生间(上图)。他每天都去健身房,洗完澡开车回公园睡觉。至于脏衣服,周末带回老家去洗。

4、特斯拉上周采用无人驾驶,向客户交付了一辆汽车。

汽车从工厂下线后,自己开到客户家里,全程30分钟,中间还走了一段高速公路。

5、美国本周启用"鳄鱼恶魔岛"监狱,用来拘留非法移民。

这个监狱位于热带的佛罗里达州,建在废弃飞机场的跑道上。

它根本没有墙,因为周围都是大型沼泽地(上图),里面生活着大量鳄鱼,囚禁者没法越狱。想到在这个地方建设监狱的人,真是有想象力。

6、微软正式规定,评估员工绩效时,要考核 AI 使用量,强制要求员工必须使用 AI。

文章

1、Meta 的 AI 人才名单(英文)

《华尔街日报》的报道,Meta 公司搞了一个50人的名单,包括了世界最顶尖的 AI 人才,准备把他们都挖过来,甚至传言开出了1亿美元的天价薪水。

我们可以从中了解,AI 人才的身价有多高,争夺有多么激烈。

2、ECMAScript 2025 的新增语法(英文)

JS 语法标准发布了2025版,本文罗列了今年的7个新增语法。

3、2010年江西高考理科数学压轴题(中文)

知乎上有个问题是高考数学最后一题可以有多难?公认史上最难高考数学题就是2008年江西高考理科数学压轴题,2010年的题目也很难。(@longluo 投稿)

4、通过超声波发送数据(英文)

本文介绍如何让手机浏览器发送超声波,并把数据编码在里面,从而就可以在用户毫无察觉的情况下,跟其他设备通信。

5、我的程序员人生(英文)

作者的一篇回忆文章,总结了自己的人生,写得很鼓舞人。

他在高中想学舞蹈,但是被 3D 动画片吸引,去读了计算机本科,毕业后成了 Python 程序员,后来靠着自学和努力,现在是分布式系统研究员。

6、如何用 JS 写一个浏览器的语音朗读器(英文)

本文是一篇 JS 教程,教你用浏览器的 API,通过内置的 TTS 语音引擎,写一个句子朗读器。

7、Cloudflare 和 Vercel 的沙盒功能(英文)

最近,CloudflareVercel 这两家公司,不约而同推出了沙盒功能,运行不受信任的 JS 代码,主要用例是执行大模型生成的代码。

工具

1、code-server

VS Code 的一个服务器版本,让用户通过浏览器使用这个代码编辑器,不需要本地安装,参考介绍文章

2、OpenFLOW

绘制网络基础设施图的开源工具。

3、Sniffnet

一个开源的跨平台桌面应用,用来监控本机的网络通信。

4、WR.DO

一个自搭建的域名服务平台,可以基于域名创建子域名、短链接、邮件地址,并提供 API 接口。(@oiov 投稿)

5、Pip-Helper

开源的浏览器插件,为主流视频网站提供画中画播放功能。关闭浏览器,画中画窗口依然打开。(@yaolifeng0629 投稿)

6、Gwitter

自搭建的个人微博平台,数据存储在 GitHub issues。(@SimonAKing 投稿)

7、Melody Auth

自搭建的身份认证服务,支持社交平台、邮箱、短信等认证方式,可以作为 Auth0 的替代品。(@byn9826 投稿)

8、SVG to 3D

这个网站将平面的 SVG 文件,免费转成 3D。(@wujieli0207 投稿)

9、CodeBox

一个在线的二维码生成平台,可以定制各种属性。(@gdfsdjj145 投稿)

10、Technitium

一个自搭建的家用 DNS 服务器,带有 Web 界面,参见介绍文章

AI 相关

1、GitHub Copilot

微软开源了 VS Code 的 GitHub Copilot Chat 插件,用来跟 AI 对话。据说,GitHub Copilot 本体(主要完成代码补全和生成)很快也会开源。

2、CAPTCHA-automatic-recognition

一个油猴脚本,通过 AI 自动识别填充网页验证码。(@ezyshu 投稿)

资源

1、Rust 新手快速教程

一个针对新手的 Rust 快速教程,从零开始写一个管理 Todos 的命令行程序。(@InkSha 投稿)

2、B 树互动教程(英文)

这篇教程通过很多互动示例,讲解数据库常用的 B 树数据结构。

3、River Runner Global

全球任意地点的一滴雨,会流到哪里?这个网站给出雨水的流动路径,点击下雨的地点,它会可视化雨水的地面路径。

4、Traffic.cv

免费的网站流量信息查询工具。(@typewe 投稿)

图片

1、xAI 办公室

推特上面,有人贴出了马斯克 xAI 的办公室照片。

你要知道,那里员工的身价都是百万美元、千万美元级别的。

2、美国邮政(USPS)250周年

美国邮政局(USPS)成立于独立战争期间,具体日期是1775年6月26日,上周是250周年纪念日。

为了纪念这个日子,它发行了一组20枚连在一起的套票。

邮票上是一个典型的美国小镇,街道上唯一的车辆是递送信件和包裹的邮车。大家可以数一下,一共有几辆。

邮票共分4行,每行5枚,从上到下描绘了四个季节。

文摘

1、芯片的种类

摘自《芯片战争》,[美]克里斯·米勒(浙江人民出版社,2023)

21世纪初,半导体已分为三大类。

第一类是逻辑芯片,就是以逻辑运算为主要功能的芯片,智能手机、计算机、服务器的处理器都属于这一类。

它的性能强弱主要跟制造工艺有关,内部集成的晶体管越小,性能越强。摩尔定律讲的就是这一类芯片。

第二类是存储芯片,就是存储数据的芯片,分为 DRAM(内存芯片,短期存储数据)和 NAND(记忆卡芯片,长期存储数据)。

DRAM 过去有几十家生产商,但现在主要是三大巨头:美光、三星和 SK 海力士。后两家都是韩国厂商,美光虽然是美国公司,但它的工厂大多收购而来,所以主要也是在亚洲生产。

NAND 的生产商之中,三星最大,占据了35%的市场份额,其余有韩国的 SK 海力士、日本的铠侠、美国的美光和西数。

第三类是其他芯片,包括模拟信号转换为数字信号的模拟芯片、与手机网络进行通信的射频芯片,以及管理设备如何使用电力的电源芯片。

这一类芯片的功能与制造工艺基本无关,而与设计有关,所以摩尔定律对它们不生效,大约四分之三的此类芯片还在用180纳米或以上的工艺生产。

由于不需要使用更小的晶体管,也不需要经常升级,它们的制造成本要低得多。如今,最大的模拟芯片制造商是德州仪器(TI)。

言论

1、

2022年11月30日是一个永载史册的日子,就像第一颗原子弹爆炸,OpenAI 公司推出了 ChatGPT,从此人类再也没有了未被 AI 污染的新数据。

-- theregister.com

2、

HTTP 原本用于学术论文。现在它运行着文明。

-- 《MCP:一个意外的 AI 插件系统》

3、

孤独是一个建筑问题。

现在的很多建筑物,不利于人们聚集。我们需要的建筑物,应该是方便步行,并且免费,不属于任何人。以前的城市,有很多这样的地方。

-- 《如何走出家门》

4、

20世纪90年代,一些工程师意识到:显卡本质就是一个并行处理设备。

在屏幕上进行图像渲染,这是一个可以并行处理的计算任务----每个像素点的色彩可以独立计算,不需要考虑其他像素点。

-- 余盛《芯片战争》

5、

我感觉,如果美国取消芯片出口管制,中国政府就会实施芯片的进口管制,以保护国内芯片产业,打造一个真正能与英伟达/台积电/苹果/谷歌抗衡的芯片制造商。

-- Hacker News 读者

往年回顾

工作找不到,博士能读吗?(#308)

卡马克的猫(#258)

晋升制度的问题(#208)

内容渠道的贬值(#158)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年7月 4日

科技爱好者周刊(第 354 期):8000mAh 手机电池,说明了什么?

作者 阮一峰
2025年6月27日 08:13

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

成都推出机器人交警。(via

8000mAh 手机电池,说明了什么?

大家发现了吗,手机的电池正在越变越大。

你可以看一下你的手机,电池容量是多少。

仅仅三四年前,手机电池一般都是 4000mAh(毫安时),最多就到 5000mAh。

但是在去年(2024年),电池容量增加到了 6000mAh。今年(2025年)更是出现好几部 8000mAh 的手机

更让人惊奇的是,这些手机并没有因为更大的电池,而变得更重更厚。

以某品牌的 8000mAh 手机为例,重量209克,厚度7.98毫米,跟一般的大屏手机差不多。

为什么手机塞进了更多的电池,却没有变重?

原因很简单,电池技术在这几年出现了突破

大家应该听说过"固态电池"。它不同于现在的锂电池,最大特点是更高的能量密度,也就是同样的重量可以储存更多的能量。

但是,固态电池还在测试中,量产时间最快也要等到2027年。目前,真正进入市场的是"半固态电池"。

半固态电池介入传统锂电池与固态电池之间,电解液是固态和液态的混合物。

2023年4月份,宁德时代宣布将要生产凝聚态电池,也就是半固态电池。

根据厂家公布的数据,这种电池的能量密度是 500 Wh/kg,也就是每公斤可以储存0.5度电,传统锂电池的能量密度是 250 Wh/kg。

所以,手机从锂电池换成半固态电池,重量不变,电量翻一倍,正好从 4000mAh 增加到 8000mAh。从时间上看,半固态电池是2023年发布,2024年投产,2025年进入消费电子产品,时间也刚好。

可以预期,随着越来越多手机换成半固态电池和将来的固态电池,续航时间不再成为问题,充电焦虑将彻底消失。

以今年发布的 8000mAh 手机为例,续航时间就非常惊人。根据评测,它可以连续播放25小时的视频。也就是说,中度或轻度使用时,可以两天一充,甚至三天一充。

半固态电池只有中国厂商量产了,目前只用于中国品牌的手机。三星旗舰手机 S25 Ultra 的电池容量,还停留在几年前的 5000mAh,苹果就更差劲了,iPhone 16 Pro 是 3582mAh,iPhone 16 Pro Max 是 4685mAh。所以,中国品牌手机在电池上是世界领先。

固态电池的应用,不限于手机。有报道说,比亚迪正在测试固态电池的汽车,续航里程居然可以达到1875公里。

这意味着,一次充满电,可以从上海开到成都(直线距离1600公里),太不可思议了。

固态电池还使得电动飞机成为可能。飞机需要大量能源,同时又不能有太大的起飞重量,固态电池正好满足。中国的电动飞行器,很可能会像电动汽车一样,成为下一个在全球竞争中脱颖而出的产业。

科技动态

1、世界最长的航线

本周,中国东航宣布将开通中国到阿根廷的航线,这将是两国之间的唯一直航航线,也是世界最长航线。

在地球仪上,从中国传过地心就是阿根廷,两国之间的距离,相当于赤道的一半。因此,地球任意两个城市之间,几乎不可能有更长航线了。

赤道的长度是4万公里,这条航线是19,680公里。没有任何民航客机,可以一次性飞2万公里,所以这条航线中途会在新西兰落地休息。

整个飞行时间大约24小时~25小时,十分辛苦,上海到新西兰要11个小时,新西兰到阿根廷又要十几个小时。

2、一家以色列的 AI 编程公司,上周以8000万美元被收购

这家公司刚刚成立半年,31岁的创始人一开始是兼职的,现在全公司也只有8个人。

它年初才成立,五月份首次实现盈利18.9万美元,六月份就以8000万美元被收购。

这到底反映了我们正处在 AI 的泡沫,还是验证了 Sam Altman 的预言:"AI 会创造一个人的独角兽(估值10亿美元的创业公司)"。

3、本周,比尔·盖茨与托瓦兹见面了。

上面照片中,左一是微软 Azure 云服务的首席技术官 Mark Russinovich,他组织了这次饭局。

左二是 Windows 创始人比尔·盖茨,右二是 Linux 创始人托瓦兹(Linus Torvalds),右一是 Windows NT 的首席架构师 Dave Cutler。

比尔·盖茨与托瓦兹从未见过,这是两人第一次见面。多年前,Windows 和 Linux 互相将对方视为敌人,现在创始人都老了,终于一笑泯恩仇。

4、问答网站 Stack Overflow,快要被 AI 消灭了。

五月份,整个网站上的新发布问题只有20000个,跟刚上线的2008年下半年相仿。

6月份更惨,截止到6月25日,新发布问题只有12015个。

最高峰的2020年,每月的新问题超过30万个。它的访问量曾经排名全球前50名,就这样被 AI 淘汰了。

5、一项研究确认,AI 影响了网站的访问量。

研究发现,谷歌搜索的 AI 总结,让其他网站的访问量下降了30%。

可以想像,随着 AI 大量使用,网站的访问人数还会大大下降。

文章

1、智能插头当作网站开关(英文)

作者想了一个很聪明的方法,将智能插头当作网站的浏览开关。

如果本机通过 Wifi 检测到插头,就立刻修改/etc/hosts文件,使得某些社交网站无法访问。反之,拔出插头,则计算机将该文件再改回原样。

2、网页压缩算法比较(英文)

服务器发送给浏览器的网页,一般都是压缩的,主要有四种算法:gzip、deflate、brotli、zstd。

作者用 Go 语言测试,哪种压缩算法对服务器开销比较小。

3、巧解 Docker 镜像拉取失败(中文)

本文介绍一种拉取 Docker 镜像的变通方法:通过 GitHub workflow 拉取,然后存储到阿里云个人镜像站,并给出脚本。(@you8023 投稿)

4、CSS 的部分关键帧(英文)

本文是 CSS 中级教程,介绍 CSS 动画如果只写一个关键帧(起始/结束),也有很多应用场景。

5、让 Claude Code 使用其他模型(中文)

Claude Code 只能使用自家模型,本文介绍使用 Claude Bridge,让它可以使用任意第三方模型,从而极大降低使用成本。(@jerrylususu 投稿)

6、git notes 命令(英文)

git 有一个鲜为人知的 notes 命令,可以往日志添加自定义数据,很适合为每次提交加入元数据。

7、如何减少 OpenAI 的音频/视频费用(英文)

作者让 OpenAI 概括一个视频的内容,意外发现,如果让文件的播放速度加快到2倍或3倍,OpenAI 的处理费用可以减少30%以上。

原因可能是,加速会让一些短音节变得不明显,从而减少输入 token 的数量。

工具

1、postmarketOS

一个专门适配移动设备的 Linux 发行版,适合将过时的手机变成 Linux 设备。

2、to-userscript

一个命令行工具,可以将浏览器插件转成 userscript,方便移植。

3、Reeden

纯本地的电子书阅读软件,支持多个平台,免费版没有数据同步和 AI 功能。(@unclezs 投稿)

4、AdaCpp

一个基于浏览器的在线 C++ 学习环境,可以编辑/编译代码,并有 AI 的代码解释。(@xueywn 投稿)

5、Moocup

一个为图片加上背景渐变色的在线工具。

6、浸入式学语言助手

开源的浏览器翻译插件,根据设定的外语水平,帮助在日常网页浏览中自然地学习外语。(@xiao-zaiyi 投稿)

7、EasyDisplay

通过局域网展示数位看板的解决方案。(@yyfd2013zy 投稿)

8、QueryBox

跨平台的桌面端 GraphSQL 调试工具。(@zhnd 投稿)

9、RingLink

国产的远程设备互通组网的工具,类似于 Tailscale。(@Aplusink 投稿)

10、LogTape

JS 日志库,号称性能好,功能强,参见介绍文章

11、Project Indigo

Adobe 推出的一款免费的 iPhone 相机,比原生相机更简单易用,融入了 AI 的自动调整,参见介绍文章

AI 相关

1、Gemini CLI

谷歌推出的基于终端的 AI 客户端,可以完成各种 AI 操作,包括调用谷歌的视频模型 Veo 和图像模型 Imagen。

此前,其他 AI 公司已经发布了类似的命令行产品,比如 Claude CodeOpenAI Codex (CLI)

2、Twocast

真人 AI 播客生成器,一键生成 3~5 分钟播客,支持多语言、多音色,免费开源。(@panyanyany 投稿)

3、Duck.ai

DuckDuckGo 推出的免费 AI 聊天服务,强调保护用户隐私。

资源

1、My Ringtone

免费无需注册的铃声搜索下载网站,提供 MP3 格式铃声。(@twjiem 投稿)

2、维基电台 Wiki Radio

这个网站随机播放,维基百科里面的音频文件。

3、ICONIC

一个开源的图标库,专门提供各种软件技术的图标。

4、Linux/Windows 开发 iOS 应用教程(英文)

一个图文教程,使用 xtool 工具在 Linux/Windows 上开发 iOS 应用。

图片

1、印度裔掌管的美国科技公司

印度人在美国科技界有着庞大的势力,下图是印度裔掌管的美国科技公司的不完全列表。

微软、谷歌、IBM 都是印度裔掌管的。

2、迪士尼绿

迪士尼乐园使用绿色,对很多基础设施进行油漆。

这样做的目的是,尽量减少游客对基础设施的关注。

这种绿色就被称为"迪士尼绿"。

文摘

1、离职面谈是不必要的

当你即将离职,HR 可能想找你进行一次"离职面谈",询问你"为什么要离职?",以及"跟同事一起工作感觉如何"。

别上当。你的最佳选择是,推掉这些离职面谈,如果不行,那也不要对任何人或任何事进行批评。

你可以回答,你遇到了一个不想放过的机会,然后很荣幸能跟曾经的同事一起工作,对于这家公司曾经给予的工作机会,充满感激。就这样,离职面谈就可以结束了。

这有几个原因。

(1)离职面谈不会给你带来任何好处,反而会带来很多负面后果。

你的建议和反馈,不会得到采纳和改进。反而,你会被别人认为是一个爱抱怨的人,并可能因此树敌。

没人想树敌。你或许以为自己再也不用和那些领导和同事打交道了,但这个世界真的很小。

(2)一旦你递交了辞呈,在你离开公司之前,你的目标就是让人们永远记得你,对你留下好印象。

你要优雅地离开,不要破坏任何人际关系。无论你心里认为,老板有多愚蠢,部门有多糟糕,都不要说出来。说出来不会有好结果,只会伤害你自己。

(3)同理,不要给同事们发一封冗长的告别电子邮件,告诉他们你为什么离开,这毫无意义且有害。

人们对这种事的记忆力很强。发一封邮件抱怨公司有多糟糕,你就会以这种方式被人们记住,很有可能还会传开,而你所做的一切好事都会被人们忘记。

(4)如果你真的对公司运作有什么建议,最好没辞职的时候就说出来。如果那样没有效果,那么你在离职面谈中给出忠告,更不会有效果了。

(5)离职后,原来的公司变好或变坏,都跟你无关了。你也不应该再关心那些问题了。

总之,最好的离职就是不惹恼别人,悄悄地离开,全力以赴你接下来的路。

言论

1、

AI 使得我的90%技能,价值变为0,但使得剩下的10%技能,价值增长了1000倍。

每个人在 AI 面前,都需要重新调整自己的技能。

-- Kent Beck,极限编程的创始人

2、

Anthropic 公司为了训练模型,聘请了谷歌图书扫描项目前主管汤姆·特维(Tom Turvey)。

他的任务是获取"世界上所有的书籍",花费数百万美元购买了数百万本纸质书籍,新的和二手的都有。然后,把这些书都拆了,进行扫描,完成后就扔掉。

-- 美国法院判决书,出版公司控告 Anthropic 未经许可使用版权书籍训练模型,法院一审判 Anthropic 胜诉

3、

西方国家的博士学位,基本上是移民计划,而大学很乐意配合。

-- Hacker News 读者

4、

企业将来不会区分"Python 程序员"或"React 程序员",招聘的时候,不会在意你会什么语言。企业只会招聘能够解决问题的程序员,不管他们的技术栈。因为有了大模型,编程语言障碍已经完全消失了。

我们已经到了这个地步:学习哪种编程语言无关紧要。现在真正的技能是系统设计、架构、DevOps、云计算----那些在 AI 之上快速构建系统的技能。

-- Reddit 读者

5、

社会的危机,不是人变得孤独,而是人变得隐形、没有用处、可有可无。

-- 《隐形的人》

往年回顾

不要看重 Product Hunt(#307)

黄仁勋的 Nvidia 故事(#257)

汽车行业的顶峰可能过去了(#207)

KK 给年轻人的建议(#157)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月27日

国产 AI 网页开发工具:豆包 AI 编程简单测评

作者 阮一峰
2025年6月24日 10:49

一、引言

AI 编程(AI coding)是眼下的热点,但它其实不是单一功能,而是分成不同的方向。

其中的一个方向,就是 UI 生成,尤其是生成网页的 UI。

UI 生成涉及到视觉设计,需要专门的 AI 工具。国外已经有不少这类产品,比如 v0.devlovable.devbolt.new

它们能够根据你的文字描述,自动设计和生成网页,并部署上线。

我一直想来测评,这些 UI 生成器到底好不好用,可惜只有开通付费版,才有完整体验(包括最新、最强的模型)。

二、豆包

上周,我发现字节旗下的豆包,也上线了 UI 生成功能,能够直接生成网页应用了。

官方还特别加注"应用创作 1.0",唯恐你没注意到。

原因好像是底层的豆包大模型发了1.6版,代码生成能力大大加强。官方宣传,它在多个测试集上,得分属于国际第一梯队。

出于好奇,我就对它做了简单测评。它是完全免费的,而且对于国内用户,这种国产工具要比国外竞品更易上手。

三、基本功能

点击菜单的"AI 编程"选项,就进入了编程界面,就是一个大的输入框,下面有几个示例。

废话少说,我直接输入:

生成一个电商网站。

系统立刻转入代码生成页面,左侧是 AI 对话栏,右侧是不断滚动生成的网页代码(下图)。

等到代码生成完毕,右侧就会切换为生成的网页预览。

为了便于展示,我把这个页面分享出来(点击右上角的"分享"按钮)。

大家自己看效果吧(点击这里)。

声明一下,这是系统直接生成的,我没做任何修改。

我觉得,不足10个字的输入,能生成这样的网页,算可以了,反正是超过了我的预期。

虽然这个页面看上去能用,但许多细节需要修改。

四、可视化编辑

修改的时候,我发现,豆包的编辑功能做得挺好,完全是可视化编辑,不懂代码的人也能上手,其他竞品好像都没有做到这种程度。

豆包的可视化编辑,分成 AI 编辑和手工编辑。

4.1 AI 编辑

AI 编辑就是在左侧的 AI 框,直接输入指令,让 AI 帮你编辑。

编辑过程就像下图,选中标题,输入指令"优化表述,同时改为艺术字",就立刻生效了。

一条指令可以修改多处,每次修改系统都会实时保存,不用手动保存。

4.2 手工编辑

手工编辑就是直接在前端,自己动手修改文字和图片。

先点击上方的"编辑"按钮,进入编辑状态。

然后,选中要修改的元素,进行编辑。

举例来说,AI 生成的网页,配图往往不匹配,需要更换。

上图中,图片应该是蓝牙耳机,AI 却配了一张笔记本电脑的图片,需要更换。

在编辑状态下,选中这张图片,下方会出现一个编辑框。

里面有三个选项。

  1. 智能生图:AI 生成图片。
  2. 一键搜图:搜索系统图库。
  3. 本地替换:上传本地图片。

选中第一项"智能生图",输入"蓝牙耳机",就会得到 AI 生成的蓝牙耳机图片。

五、文本秒变网页

豆包的这一次更新,还有一个"文本秒变网页"的功能,我觉得很实用。

它能把长文本(会议记录、旅行攻略、新闻报道、论文等等)经过 AI 解读,自动变成网页

具体来说,对话框底下,有一排功能按钮,第一个就是这次新增的"文本秒变网页"。

点击它,输入框就会出现一句系统提示:

"分析以下内容,并将其转化为清晰美观的可视化 HTML 网页。"

你把长文本贴在这段提示下面,就可以了。比如,你贴一篇研究报告,AI 就会进行内容总结,然后将总结的内容生成网页。

更实用的是,长文本还可以通过 AI 生成。具体做法是在聊天界面,让 AI 生成长文本,然后切换至 AI 编程,输入指令"把上述内容转化成 html 网页"。

举例来说,先跟 AI 聊天,"帮我制定三天两晚的6月杭州旅游攻略"。

AI 会滔滔不绝,生成一大段文字(点击查看)。然后,你切换到 AI 编程,输入"帮我把上述信息转化为可交互的 html 网页"。

网页就生成好了(点击查看)。

有了这个功能,AI 的内容生成与网页生成,就一体化了。

于是,玩法就无穷无尽了。比如,上传会议的录音文件,生成会议记录网站;上传文献,生成内容介绍网站;让 AI 分析财务报表,生成折线图、流程图的分析网站。

六、总结

试用下来,我对豆包这次的网页生成功能,印象很好,觉得很实用,完成度也高,是一个有用的工具

首先,模型生成的页面效果,比我想象的好,是可用的。

其次,可视化编辑很好用,操作方便,上手门槛低,适合新手和不懂编程的项目经理、设计师等。

豆包团队重点打造这个功能,表明他们对 AI 编程现状有清醒的认识:AI 生成的页面,还无法一次就达到理想的状态,所以要把编辑功能做好,方便修改调优。

最后,对比国外的竞品,它有更好的本土化。除了中文界面和用法提示,它生成的网页风格,明显就是用了本土化的模版,而不是国外设计师的风格。

如果要说缺点,大概是 JS 脚本能力还不够令人满意,有一些页面的互动效果,不能一次成功,需要跟 AI 纠正多次。

总之,在前端应用生成这方面,豆包的 AI 编程是一个有生产力的产品,美观度和可用性都比较强,又是免费的,大家可以自己动手试试看

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月24日

科技爱好者周刊(第 353 期):苹果的"液态玻璃"是为了 AR

作者 阮一峰
2025年6月20日 08:08

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

6月17日晚,重庆举行超大规模无人机表演,共有11787架无人机,上图是其中一个场景"天上的重庆"。(via

苹果的"液态玻璃"是为了 AR

上周,苹果公司发布了新的设计风格"液态玻璃"(liquid glass)。

这种风格使用液体玻璃,作为控件(上图)。早先的扁平化风格,被一股脑抛弃。

下图左面是原来扁平化风格的 iPhone,右面是这次测试版的液态玻璃。

我知道的绝大部分人,对这种新风格都是差评,觉得不好看。大家想不通,为什么苹果要在屏幕上,添加一个额外的半透明玻璃层。

甚至有人说,如果乔布斯看到 iPhone 变成这样,会解雇所有人(下图)。

那么,到底为什么呢,苹果好端端的,突然要大改界面?

官方完全回避这个问题,我倒是看到一篇解读,提出了一个很有见解的猜测。

他说,苹果这样做,压根不是为了审美,而是为了下一代的空间计算,也就是 AR

现在的计算设备,都是二维的平面交互,用户面对一个扁平的屏幕,所以适合二维的扁平化风格。

但是,对于 AR 设备,用户进入的是一个 3D 空间,接触的东西都是立体的,所以需要一个立体的界面。

AR 设备没有屏幕,只有空间。屏幕不重要,空间才重要

液态玻璃就是一个空间设计,目的是让界面有一个实体,让你感觉每个按钮都是一个有体积的实物。并且,它半透明,不会遮住后面,从而产生空间层次感。

从这个角度,苹果的界面设计副总裁 Alan Dye 对液态玻璃的介绍,就很容易解读。

每个元素都经过精心设计,赋予了它们物理感:它们具有维度,能够动态响应光线,并投射阴影。

苹果的 AR 设备,目前只有 Vision Pro 头盔。

液态玻璃界面,应该最初是为了这个头盔设计的。在 AR 空间中,操作界面就是一块悬浮的玻璃,这非常合理。

苹果为了统一设计语言,索性让 iPhone 和 Mac 也用了它。开发者只需要设计一次,就能适配所有苹果设备。

这样做,有利于推广 AR。试想一下,用户在手机和电脑上,已经熟悉了液态玻璃风格,当他最终戴上 AR 设备时,就不会对这种界面感到陌生,仿佛 AR 设备只是 iPhone 的自然延伸。

如果苹果确实是这样的考虑,那么我们可以确定,苹果下一步会大力推广空间计算

Vision Pro 虽然卖得不好,但是苹果不仅不会放弃它,反而会加大投入,很可能还会推出轻量级的 AR 眼镜。

AR 也许是计算机行业的下一个热点,苹果已经在布局。

并且,液态玻璃界面要求实时模糊、动态透明、情境照明。这些效果需要强大的 GPU 实时渲染,这正是苹果芯片的强项,对手的硬件可能会出现卡顿,从而进一步加大苹果的优势。

科技动态

(1)Meta 公司推出 AI 广告,用户上传产品照片,系统就会自动生成广告视频,并配好音乐和文案。

未来,广告的制作成本越来越低,注定会无所不在,并且还会针对每个人,生成个性化广告。

(2)加拿大有一只小乌龟,断了一只脚。一家博物馆用乐高积木,为它制作了助行器

这件事很有意义,因为乌龟的寿命很长,可以达到50年~80年。助行器能帮助它几十年。

(3)美国国防部研究局 DARPA,创造了无线传输能量的世界纪录。

他们使用激光,在8.6公里外传输能量,持续了30秒,每秒功率超过800瓦。这是迄今无线传输能量的最远距离。

上图是激光接收器,激光进入中心的孔以后,会被反射到内部的数十个光伏板,这些光伏板将能量转换回电能。

(4)除了人形机器人,还有虫形机器人

一家美国公司制作了蜈蚣机器人,它可以爬行,适合起伏的地形,目前用来除草。

(5)一项研究发现,手写能增加大脑活动和参与度,比键盘打字更有利于记忆和学习。因此,学习重要的内容,可以尝试手写。

文章

1、CSS class 的替代方法(英文)

作者认为,网页元素的 class 属性有很多弊端,可以不用,改用替代写法,很有启发性。

2、短信发送天气预报教程(英文)

本文介绍怎么使用短信,给自己发送天气预报。

3、更好的 Shell 历史搜索(英文)

本文教你怎么打造更好用的 Shell 历史搜索。

4、让 NotebookLM 更好用的3个浏览器插件(英文)

谷歌的 AI 笔记应用 NotebookLM 非常有用,本文介绍三个 Chrome 插件,让它更易于使用。

5、SSL 为何改名为 TLS(英文)

HTTP 的加密协议 SSL,后来改名为 TLS,本文解释原因,完全是大公司斗争的产物。

6、自适应网页的正确写法(英文)

为了适应手机浏览器,网页的 HTML 头部一般会加上缩放命令,比如width=device-width。本文介绍这个命令的正确写法。

工具

1、Vince

网站流量统计分析工具,Google Analytics 的自托管替代品。

2、worklenz

一个开源的团队项目管理工具,自带后端和前端。

3、Kopia

一个开源的备份/恢复工具,可以将指定的目录或文件,备份到云存储服务商,有命令行和图形两种界面。

4、Eyesite

一个开源的实验项目,用摄像头捕捉用户的目光移动,从而代替鼠标,参见介绍文章

5、Unbound

自搭建的家用 DNS 服务器。

6、Rspamd(英文)

开源的垃圾邮件过滤系统,用来检测垃圾邮件。

7、Sync your cookie

开源的 Chrome 插件,将 Cookie 同步到 Cloudflare,用于在不同设备之间共享 Cookie。(@jackluson 投稿)

8、Link Checker

网站链接检查器,输入网站链接,找出其中的死链接,代码开源。(@isixe 投稿)

9、Ayanami

纯前端的像素编辑器,支持帧动画。(@KamiC6238 投稿)

10、chromium-style-qrcode-generator-with-wasm

使用 Rust 和 WebAssembly 技术的 Chrome 风格二维码生成器,纯网页应用,不需要后端。(@liuliangsir 投稿)

资源

1、Daily arXiv AI Enhanced

每日自动抓取 arxiv 论文,并使用 AI 进行汇总,使用 GitHub Pages 进行展示。(@dw-dengwei 投稿)

2、中国城市地铁可视化

一个交互式网页可视化应用,展示中国城市地铁线路,代码开源。(@thecuvii 投稿)

3、Thiings

一个搜索下载 3D 图标的网站,现有近3000个图标。

4、无字证明(Proofs without words)

这个网站收集各种数学定理的图像证明,上图是前 n 个奇数之和等于 n 的平方。

图片

1、Reddit 的子频道

Reddit 是美国最大的网上社区,有无数个子频道。任何关键字,都能创建一个子频道,类似于百度贴吧。

下图是按照成员人数的 Reddit 子频道排名。

不知道看哪个频道,可以先去上面这些频道,比如排名第一的 Funny 频道

2、Meat 的五次收购

上图是 Meat 历史上五次最大的收购。

其中,第二大收购是上周刚刚完成的,这个交易非常奇特。

Meta 以143亿美元投资 Scale AI,获取后者的少数股权,并让后者的28岁 CEO 亚历山大·王(Alexandr Wang)辞职加盟 Meta,负责 AI 部门。

也就是说,Meta 实际上是花了143亿美元,挖角了亚历山大·王这个人。AI 人才的价码之高,令人咋舌。

文摘

1、胶水工作重要吗?

"胶水工作"(glue work)指的是,帮助做出产品、提高效率的一些辅助工作。

举例来说,更新文档、解决技术债务、培训新人、维护团队成员的正常交流等等,都属于胶水工作。每个团队都需要大量这类工作。

我认为,胶水工作非常重要,如果没有它们来粘合整个团队,就很难做出大型产品,也无法减少大型组织中的摩擦

有些工程师因此很天真,将大量精力花在这些胶水工作。但是,在晋升或发放奖金时,这些工程师往往被忽视,公司更看重那些销售直接相关的工作(如开发新功能)的工程师。

为什么胶水工作不能让你得到晋升呢?

是因为公司太愚蠢,看不到这些工作的价值吗?我不这么认为。

公司不奖励胶水工作,因为他们不想让你优先考虑它,而想让你更重视产品的发布。胶水工作很辛苦。如果你有能力做好胶水工作,他们希望你把这种能力用在产品发布,而不是提高团队效率。

你必须明白,让团队更顺利地运行不是你的工作,你的真正工作是执行公司领导层的使命

有一个很少人知道的事实是,与其花大量时间提高团队效率,不如让团队以60%的效率运行。

这里有两个主要原因。

(1)如果团队以100%的效率运行,团队成员不可避免地会精疲力尽,这对每个人都不好。

(2)最好让团队成员习惯于在公司的基本效率水平上运作,而不是在短时间内人为地消除摩擦。因为低摩擦的状态不可能长期持续,这要求巨大的投入。

大型科技公司在任何时间内都以大约20%-60%的效率运行(公司越大,运行效率越低)。大公司的增长主要在于占据更多的市场,而不在于提高效率,所以公司不在意让团队效率提高到一个很高的水平。另一方面,如果个别员工愿意在胶水工作上投入大量时间,将团队的效率提升到80%或90%,公司将利用这种免费价值,但公司对长期锁定这种价值没有任何真正的兴趣,因为这取决于优秀的人才自愿奉献时间,是不可持续的。

所以,结论就是,公司需要有一些胶水工作,但是不需要太多的胶水工作。

作为开发者,你的正确做法应该是,在战术层面上做一些胶水工作,而不能把胶水工作提高到战略层面

也就是说,你应该把胶水工作视为额外工作,你的关注重点永远应该是项目的成功。你不会因为胶水工作而得到特别的奖励,但你会因为项目的成功而获得奖励。

言论

1、

政府的软件采购方式,花费大量资金,引发大量新闻报道,涉及大量人员,但最终不会有一款软件真正进入工作,用户仍将使用 Excel 处理所有事情,使用 PowerPoint 生成幻灯片。

-- Hacker News 读者,评论美国国防部向 OpenAI 采购2亿美元 AI 模型

2、

未来,你还是需要学习编程。因为你需要能够准确地告诉 AI 你想要什么,了解计算机的工作原理有助于你编写更精确的提示和指令。

-- 吴恩达,著名 AI 科学家,斯坦福大学教授

3、

宇航员在太空洗衣服吗?答案是不洗。

国际空间站的供水很有限,根本没有设计洗衣服的功能。宇航员的衣服弄脏以后,要么继续穿,要么直接扔掉。脏衣服会在返回大气层的时候,全部烧掉。

-- 《宇航员在太空洗衣服吗》

4、

我担心,以后在重要的媒体中,实质性内容将逐渐衰落,30秒的片段会流行,节目只具有最低的共识,充斥着对伪科学和迷信的盲目介绍,尤其还有一种对无知的庆祝。

-- 卡尔·萨根,美国著名科普作家,这段话写于1994年

往年回顾

信息就像糖一样上瘾(#306)

最酷的乐高作品(#256)

如何走出失望和怀疑(#206)

显卡缺货与异业竞争(#156)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月20日

科技爱好者周刊(第 352 期):Bug 追踪系统的正确样子

作者 阮一峰
2025年6月13日 07:35

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

6月6日凌晨,太原基地发射的长征六号火箭,飞过西安城墙。(via

Bug 追踪系统的正确样子

上周的话题是 GitHub Issues,把它当作笔记工具,很强悍。

但是,有些话来不及说。它的本职工作----Bug 追踪系统----并不好用

你用它来管理 Bug,就会发现有设计缺陷,用起来不顺手。

现在还活着的、历史最悠久的 Bug 追踪系统是 Bugzilla

它的一个早期工程师,前不久写了一篇文章,介绍 Bugzilla 的四条设计原则。

他说,只有满足这四点,才是一个好的 Bug 追踪系统(bug tracking system),我感到很有启发。

(1)所有任务都要列入 Bug 追踪。不仅包括代码 Bug,还包括待开发的新功能、缺失的文档、令人困惑的用户体验、糟糕的性能等等。

换言之,Bug 追踪系统本质是任务管理,应该当作项目管理系统来用。

(2)Bug 的状态有多种,不只"打开"和"关闭"两种。

大公司的 Bug 处理流程,可能很复杂,下面是一张从 Bugzilla 文档拷贝的流程图。

Bug 追踪系统应该足够灵活,可以自定义优先级、严重程度、是否已分配、是否有依赖等等,以便适配各种流程。

(3)每个 Bug 只能由一人负责。

这样才能明确责任,方便查看每个人正在做什么、接下来要做什么、以及最近做了什么。这也有利于培养开发者的归属感和成就感。

(4)支持自定义视图。

由于 Bug 有多种状态,追踪系统必须支持自定义视图查看,拥有强大的查询功能。

系统的默认视图:按照优先级,列出当前版本的所有没有关闭的 Bug。

开发者的个人视图:列出分配给他们的所有 Bug,同样按优先级排序。另外,用户可以保存自己的自定义视图。

以上四条,就是好的 Bug 追踪系统的标准。问题是 GitHub Issues 一条都没做到。

  1. 项目管理功能太弱。
  2. 状态只能靠标签。
  3. 任务可以分配给多个人。
  4. 视图默认按创建时间排序,且只能切换成标签视图。

在这方面,GitHub 甚至不如 Gitea。

举例来说,GitHub 没有办法让最重要的 Bug(P0 级别),自动出现在第一位(下图),除非手动置顶。

相比之下,Gitea(包括分叉的 Forgejo)提供了"标签集"(label set),允许一个标签有多个值,并可以按同一个标签的值排序。

上图中,标签"Priority"(优先级)有多个值,然后系统允许按照 Priority 的值排序。

[本周软件] 开源知识库 PandaWiki

小团队和个人,如何管理大量文档,搭建自己的知识库?

今天,介绍一个刚刚开源的知识库管理系统 PandaWiki

它采用维基形式,可以随意编排文档,既能搭建传统的文档站,也能做成 FAQ 和博客。

它原生支持 AI 创作、AI 问答、AI 搜索等能力。你可以用自然语言跟知识库对话,也能使用嵌入模型,找出相关文档。

大家可以去 Demo 体验一下,详细了解看官方文档

它的后端使用 Go 语言编写,速度非常快。安装使用 Docker,一行命令就能跑起来。

代码库放在 GitHub,可以从那里上手,目前已经有600多颗星星。

任正非专访

本周,《人民日报》头版刊登任正非专访

下面是一些摘录。

(1)芯片问题其实没必要担心。我们单芯片还是落后美国一代,我们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。

(2)软件是卡不住脖子的,那是数学的图形符号、代码,一些尖端的算子、算法垒起来的,没有阻拦索。困难在我们的教育培养、人才梯队的建设。

(3)当我国拥有一定经济实力的时候,要重视理论特别是基础理论的研究。如果不搞基础研究,就没根。即使叶茂,欣欣向荣,风一吹就会倒的。

(4)我们要理解支持搞理论工作的。理论科学家是孤独的,我们要有战略耐心,要理解他们。他们头脑中的符号、公式、思维,世界上能与他们沟通的只有几个人。对理论科学家要尊重,因为我们不懂他的文化,社会要宽容,国家要支持。

(5)买国外的产品很贵,因为价格里面就包含他们在基础研究上的投入。中国搞不搞基础研究,也要付钱的,能不能付给自己搞基础研究的人。

(6)华为一年1800亿投入研发,大概有600亿是做基础理论研究,不考核。1200亿左右投入产品研发,投入是要考核的。没有理论就没有突破,我们就赶不上美国。

(7)人工智能也许是人类社会最后一次技术革命,当然可能还有能源的核聚变。发展人工智能要有电力保障,中国的发电、电网传输都是非常好的,通信网络是世界最发达的,东数西算的理想是可能实现的。

(8)赞声与骂声,都不要在意,而要在乎自己能不能做好。把自己做好,就没有问题。

科技动态

(1)中国科大提出"火星电池"的方案。

这种电池可以在火星上,储存太阳能的发电,在夜间释放出来。

它的原理是,电解火星大气的二氧化碳,将其转为氧气和甲烷等燃料气体,在夜间再点燃发电。

(2)华为旗下的深圳引望公司,申请了一个"可收纳方向盘"专利。

根据描述,这个专利可以将方向盘折叠起来,放入操作台里面。

(3)瑞士建造了世界最高的 3D 打印建筑:一个高达30米的观光塔,外形酷似当地的一种著名糖果。

为了增加承重能力,施工方采用了特制的混凝土材料。并且,增加了第二台机器,每打印20厘米,就往建筑物里面加入钢筋。

(4)苹果公司本周发布的新版 macOS,出现了一个细小的调整。

文件管理器 Finder 的图标左右反转了,上图左是原来的图标,右是新版图标。目前不知道,为什么要这样反转。

文章

1、过去半年的大模型回顾(英文)

Simon Willison 点评过去半年的大模型,可以当成大事记来读。

AI 的进展实在太快,去年底的模型已经是上一代了。

2、我使用 Claude Code Max 的感受(英文)

作者购买了 Claude Code 的 Max 会员,一个月要200美元,使用后认为完全物有所值。

3、速率限制交互式指南(英文)

如何限制访问速率?本文介绍了四种常用算法:令牌桶、漏水桶、固定窗口、滑动窗口。

4、Amazon VPC 图解(英文)

本文用插图解释,云服务器的虚拟私有网络(VPC,Virtual Private Cloud 的缩写)是什么。

5、五个自搭建的书签服务(英文)

本文介绍五个开源软件,可以自己架设网址书签的收藏服务。

6、我的香港露营实验(英文)

2016年,一个老外在香港留学,他的奖学金很少,就想在海边搭帐篷居住,省下房租。本文是他对这段生活的总结,挺有意思的。

工具

1、Cap.js

一个网页上的机器人识别工具,用作 CAPTCHA 方案,采用 SHA-256 工作量证明算法。

2、Quartz

Markdown 文档的静态站点发布器,适合用作收费服务 Obsidian Publish 的替代品。

3、somo

在 Linux 终端查看端口占用情况的工具。

4、OOMOL Studio

一款创新的桌面 IDE,把自己编写的函数设成节点,然后通过图形界面,把节点编排成工作流。(@BlackHole1 投稿)

5、极测

免费的通信调试助手,模拟 UDP、TCP、串口、WebSocket、ZeroMQ 等常见协议,进行通信测试。(@seasonlaw 投稿)

6、container

苹果官方发布的 Mac 电脑运行 Linux 容器的工具。也就是说,Mac 电脑可以不装 Docker,就运行 Docker 容器。

7、DarkFlare

一个命令行工具,在 CDN 上,将 TCP 流量伪装成 HTTPS 流量传输。

8、JDownloader

开源的全平台下载工具,参考这篇教程,用树莓派搭建下载服务器。

9、Pydoll

一个操作浏览器的 Python 库,通过 Chrome DevTools Protocol,实现脚本操作本机的 Chrome 浏览器。

10、Chili3D

基于浏览器的 3D CAD 软件,代码开源。

AI 相关

1、Page Magic

一个 Chrome 的 AI 插件,输入你对当前网页的修改描述,它自动将改好的网页呈现在浏览器里,需要 Anthropic API。

2、壁响(WallEcho)

根据输入的文本,免费生成手机或电脑桌布。(@twjiem 投稿)

3、AI 洞察日报

通过 Cloudflare Workers 抓取指定数据源,生成每日精选的 AI 日报,效果预览。(@justlovemaki 投稿)

4、zenfeed

智能信息助手,对于关注的新闻或话题,使用 AI 自动收集、筛选出要看的文章,并总结内容。(@glidea 投稿)

5、文颜 MCP Server

AI 模型接入这个 MCP,就可以将排版好的内容,自动发布到微信公众号,参见介绍文章。(@caol64 投稿)

资源

1、高等院校三千所

这个网站收录中国大学网址全集。(@DiamonWoo 投稿)

2、Mullvad Leta

Mullvad 公司推出的一个搜索引擎。它从谷歌和 Brave 获取搜索结果,但是提供隐私保护,防止搜索引擎识别用户。

我试用感觉不错,速度很快,没有广告。

3、DNS4EU

欧盟推出的公共 DNS,自带过滤广告功能。

图片

1、居里夫人故居的门把手

著名物理学家居里夫人,由于长期接触放射性元素,手上总是沾有镭矿石的微粒。

她在法国巴黎的故居,过了100年,至今仍能测出,门把手有微弱的放射性。

1934年,居里夫人死于过量辐射导致的再生性贫血。

2、洞穴停车场

美国密苏里州早年有石灰矿,挖出了巨大的地下空洞。

后来,矿产挖光以后,这些空洞就废弃了。

上个世纪50年代,福特汽车公司看中了这个地方。因为这里的地下空间非常大,可以容纳5000人,没有风吹雨打,没有下雪结冰,干燥,终年恒温,很适合改造成停车场,存放新车。

这个地下停车场直到今天还在运作,可能是史上最大的地下商业设施。

文摘

1、小模型

在机器学习的早期,"小模型"指的是可以在家用电脑 CPU 运行的基本神经网络。

到了2018年,如果你问别人什么是"小模型",他们可能会说,就是那种在树莓派或手机上运行的、只有几百万个参数的模型。

但是,后来出现了 Transformer 和大型语言模型(LLM)。这些模型越变越大,"小模型"的定义已经改变。

今天,任何不需要 A100 显卡集群就能运行的模型,都可以看成小模型。

我们把300亿个参数(30B)的模型也称为"小模型",因为它们只需要一个 GPU 就能运行。

今天的"小模型",更多的是指模型的可部署性,而不仅仅是模型的规模。

如果能在个人设备上部署某个模型,那么这个模型就是小模型。它可以分成下面两类。

(1)可以在移动设备或边缘硬件上运行的模型,用例为语音助手、手机翻译、离线摘要、嵌入的聊天机器人。

(2)只需一个 GPU 的模型,在这一类中,即使是 30B 或 70B 规模的模型也可以算作"小型"。

现在,一张4090显卡就能运行 70B 的模型,并有不错的输出速度,这在几年前还只是科幻小说的情节。

小模型固然比不上大模型的能力,但也有自己的优势:更适合小型的任务,在单一领域更准确,更适合微调和快速发布。

而且,小模型的成本更低,更适合个人和创业公司部署,并可以在本地部署。

这就是为什么小模型很有用,因为它让我们可以在家里运行自己的 AI 模型,得到的结果与 GPT-3.5 不相上下,从而可以用更少的资源完成更多的任务。

言论

1、

很多人总是拖拖拉拉,抱怨自己没有做事的动力。但是,动力恰恰源自行动,只要你开始做一些事情,只要能朝着目标前进,你就会发现动力随之而来。

所以,当我遇到一个很艰巨的任务时,我会把问题分解成若干更简单的部分,此时我的目标不是完成任务,而只是让自己能够行动起来,向前迈出一小步。

-- 《摆脱拖延症》

2、

最安全的代码并非优美、巧妙或优雅的代码,而是枯燥乏味的代码。

Go 语言就奉行这种理念,故意去除了那些富有表现力或优雅的写法,只保留简洁和可读的写法。这使得代码易于审查、难于滥用,不容易发生安全漏洞。

-- 《无聊胜过美丽》

3、

人们总是喜欢新东西,读书喜欢读新出版的书,听歌喜欢听新歌。

据统计,美国2024年流媒体音乐一共播放了1.4万亿次,其中近50%是2020年至2024年期间发行的歌曲,近80%是2010年或之后发行的歌曲。歌越老,听的人越少。

-- 美联社

4、

新 API 的采用速度将会大大减缓。因为大模型的学习内容仅限于已有的内容,新的 API 出现时,可供学习的内容必然很少。

另外,那些依赖大模型的人也会犹豫是否采用新 API,因为大模型使用旧 API 可以更快地完成相同的工作。

-- Hacker News 读者

往年回顾

随机数,这是一个问题(#305)

对待 AI 的正确态度(#255)

互联网风口过去了吗?(#205)

数字货币是打破美元霸权的武器吗?(#155)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月13日

科技爱好者周刊(第 351 期):GitHub Issues(几乎)是最好的笔记应用

作者 阮一峰
2025年6月6日 08:05

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

上海的华东电力设计院新大楼,有一个高达15层的户外螺旋楼梯,象征特斯拉线圈。(via

GitHub Issues(几乎)是最好的笔记应用

Issues 是 GitHub 的 Bug 管理工具,所有代码仓库都默认启用。

它不仅可以管理 Bug,还可以用于其他用途。

比如,我把它当作投稿论坛,大家在那里提交自己的项目。

再比如,很多人把它当作内容管理系统,用来写博客,或者存放自己的文章。

上周,著名程序员 Simon Willison(Django 框架的作者)提出GitHub Issues(几乎)是世界最好的笔记应用。

笔记软件这么多,为什么他独独看上了,根本不是用于写笔记的 GitHub Issues?

他给出了几点理由。

(1)免费,可以无限制使用。

(2)笔记可以公开,也可以私密。

(3)支持标签,可以给笔记分类,甚至还能分层(下图)。

(4)支持 Markdown 语法,有代码高亮,且可以插入各种图表(比如 Mermaid 图)。

(5)免费上传图片和视频。

(6)支持内部链接,可以将 GitHub 网址自动转成标题链接(下图)。

(7)自带评论和搜索。

(8)除了 Web 版,还提供 Windows、Mac、安卓、iOS 原生客户端。

(9)提供全面的 API,可以编程创建、编辑、导出笔记,还可以用 GitHub Actions 自动化几乎所有操作(比如发布到网站)。

它唯一缺少的功能,就是离线支持。如果没有网,就用不了。

这些理由,说服你了吗?

我觉得,他说的有道理,确实可以试试,将笔记软件换成 GitHub Issues。

[活动] 稀土掘金"夏日寻宝"

国内著名的开发者社区"稀土掘金",本月有新活动。

为了推广 AI 编程,他们与 Trae 合作,推出了主题为探索 Trae 智能编程世界的"寻宝活动"

Trae 是国内首个 AI IDE,提供一站式的 AI 编程环境,让中文用户轻松上手。

对于新用户,按照要求,完成一些简单任务,参与 Trae 深度体验,就能得到积分;对于老用户,邀请新人注册 Trae,同样也能攒积分。

积分兑换超丰富的奖品,积分越多,奖品越多,有大疆 Pocket 3、Apple watch、京东卡、机械键盘等等。

如果你想用好 AI IDE,又想薅点羊毛,那就别错过。

详情和报名入口,可以点击这个链接,或者扫描上方海报。现在就能报名,截止时间是6月30日。

科技动态

1、脑脊接口

上海中山医院尝试"脑脊接口"手术,来治疗瘫痪。

瘫痪的主要原因是,大脑和脊髓之间的连接中断,神经信号无法发给脊髓。

科研人员在大脑皮层植入电极,收集脑电波信号,然后将信号发送到脊髓神经,相当于在大脑和脊髓之间搭建了人工桥梁。

今年1月,他们成功实施了这个手术,使一名瘫痪患者在术后24小时内恢复站立和行走能力。

2、无血型的人造血液

日本科学家研制出无血型的人造血液。

血型的根本原因是,血液红细胞的表面有不同抗原。

为了消除血型,科学家从过期的捐献血液中,提取了血红蛋白,然后为这些蛋白做了一个保护壳。

这个壳不影响血红蛋白输送氧气的功能,但是消除了所有红细胞的表面抗原,因此就可以输送给不同血型的人体。

3、网友发现,Windows 11 的开始菜单是一个 React Native 应用。

尴尬的是,它有性能问题。点击开始菜单,很可能会让一个 CPU 核心飙升到30%到70%的使用率。

4、日本邮政推出数字地址,用户可以领取一个7位数字,代表本人地址,类似国内的邮政信箱。

邮寄时不用填写地址,只需输入这个数字。这样不仅省事,而且搬家也可以保持数字地址不变。

5、微软的 .NET 代码仓库,允许 GitHub Copilot 自动提交 PR,发生了一件令人啼笑皆非的事情

AI 自信地提交了有 Bug 的代码,人类程序员向它指出错误,AI 却表示没错。

人类程序员只能向它解释错在哪里,这个过程持续了好几遍。

以后,这样的事情会越来越多,人类苦苦向 AI 解释,为什么 AI 是错的。

文章

1、我的 Canonical 面试经历(英文)

Canonical 是 Ubuntu 背后的公司,作者记录了他的面试经历,从初试一直到老板的终面。

整个过程令人瞠目结舌,最重要的问题居然是高中成绩好不好。就凭这种面试,Ubuntu 就不值得看好。

2、microSD 卡可靠吗?(英文)

作者测试了200多张卡,发现 microSD 保存数据的可靠性很差。数据读写循环3000次后,大部分卡都会遇到故障或读写错误。

作者评价了10多个常见品牌,可以作为购买参考。

3、Go 不再修改错误处理的语法(英文)

Go 语言的错误处理,与众不同,报错会单独返回一个值,这导致代码冗余。

多年来,使用者一直要求有更好的写法,Go 团队想了很多办法,效果都不好。现在,官方终于宣布,不再寻求更好的写法,保持现状。

4、NLWeb 协议简介(英文)

NLWeb 是微软新提出的一个接口协议,类似于 MCP 协议,是网站跟 AI 大模型的对话协议,方便大模型从网站获取数据。本文是这个协议的简介。

5、运行本地 AI 的教程(英文)

这篇短文介绍,如何使用 Python 工具 llm,快速在本地计算机上运行 AI 模型。

工具

1、Quarkdown

一个使用 Markdown 语法的排版系统。

2、RsyncUI

一个开源的 Mac 应用,提供 rsync 的图形界面,用于跟远程服务器传输文件。

3、Donut

一个浏览器的编排器,可以保存各种不同的浏览器配置,根据需要快速启动。

4、Read Frog(陪读蛙)

一个浏览器插件,可以翻译页面,提取文章主要内容,给出单词和句子和详细解释,代码开源。(@mengxi-ream 投稿)

5、词小悟

主打图片识记单词的微信小程序。(@fluidog 投稿)

6、Datetime.app

开源的日期时间网站,time.is 的替代品。(@airyland 投稿)

7、naviix

网页的键盘导航库,通过上下左右的方向键,选取网页的焦点元素。(@wswmsword 投稿)

8、go-v2ex

基于 Go 语言的命令行版 V2EX 客户端。(@seth-shi 投稿)

9、TL-RTC-APP

开源的 Web 即时通信系统,基于 webrtc。(@iamtsm 投稿)

AI 相关

1、Google AI Edge Gallery

谷歌新发布的安卓 App,允许用户在手机运行 Hugging Face 上面的开源 AI 模型,即它可以让手机运行本地 AI 模型。

2、Bing Video Creator

微软旗下的 Bing 搜索引擎,加入了视频生成功能,可以使用自然语言生成免费视频,使用的是 OpenAI 的文生视频模型 Sora。

该功能目前只在 Bing 的手机 App 上开放。

3、AIDocGenius(智能文档助手)

一个 Python 脚本,集成了 AI 文档摘要、翻译、分析和格式转换。(@jiangmuran 投稿)

4、Low Fade AI

免费、免注册的换发型、发色的 AI 工具。(@twjiem 投稿)

5、Read Bridge

AI 驱动的 epub 阅读助手,通过 AI 分析书里的句子,在线试用。(@WindChimeEcho 投稿)

6、TEN VAD

一个轻量级 AI 模型,检测音频帧中是否存在人声。(@bluemotional 投稿)

资源

1、中国盲人数字图书馆

中国国家图书馆制作的盲人书库,全站使用无障碍技术,有页面工具条,所有内容可以有声播放。

2、大学生创新创业项目资源库

免费的文档资料库,包含互联网+、挑战杯、国创赛、SYB、三创等主流双创赛事。(@urongda 投稿)

3、通辽宇宙知识库

专为 B 站 UP 主"小约翰可汗"粉丝打造的互动式历史探索平台。(@Acorn2 投稿)

4、​​Reddit Top​

Reddit 热门帖子聚合网站,可以指定多个频道。(@zhangchenchen 投稿)

5、美国地址生成器

这个工具网站生成美国虚构的身份数据,包括地址、个人信息、就业状况、信用卡。(@watianle 投稿)

图片

1、班克斯的新作品

班克斯(Banksy)是欧美著名的街头画家,经常会在意想不到的地方,留下作品。

5月29日,他的最新作品出现在法国马赛市的一面墙上。

他在墙上画了金属安全柱的倒影,那是一座亮灯的灯塔。

下面写着一行字:"我想成为你所看到的我"。

意思是,虽然我只是一根不起眼的柱子,但也想成为你眼中的灯塔。

2、ChatGPT 的散文能力

一位美国用户让 ChatGPT 用文学语言,描述纽约的生活。

它这么回答。

纽约是唯一一个让你感觉神奇触手可及的地方。这里的混乱会磨砺你的雄心,每个街角都是一面镜子,让你想入非非,自己会成为谁?

你热爱纽约,因为它让你的欲望变得具体。在这里陌生与亲密共存;在这里,你可以完全的孤独,却依然跟10亿个脉搏相连。它匹配你的速度。在这里,人们选择优雅地承受痛苦:他们愿意支付高昂的租金,租住在五楼的无电梯公寓,只为了靠近城市的活力,靠近那里的野心、艺术、金钱和疯狂。

这段话的文学性令人刮目相看,AI 居然能写出这样的散文,堪比散文家。

文摘

1、太阳死亡时

大约45亿年后,太阳将进入其生命的最后阶段。

太阳内部的氢聚变核心将不断膨胀,最终成为一颗红巨星。膨胀的太阳会吞噬水星和金星,并将地球烧为灰烬。

在最好的情况下,地球将只剩下一堆冒烟的铁和镍。在最坏的情况下,它将彻底不存在。

随着太阳的热量急剧释放,太阳系的宜居带(行星表面存在液态水)将稳步向外扩展。

到了那时,木星的卫星木卫二将吸收大量热量。一方面是因为太阳的辐射,另一方面木星本身也会变得更热,反射更多阳光,从而为木卫二提供热量。

现在的木卫二是一颗冰冷的星球,被冰盖覆盖。那时,木卫二的冰壳将升华,冰壳下方的海洋将蒸发。

(图片说明:美国宇航局的木卫二探测器飞越木卫二冰壳的想象图。该探测器于2024年10月14日发射,预计将于2030年4月抵达木卫二。)

木卫二面向木星的一侧,由于吸收的热量最多,升温最厉害。此外,它的赤道带也将遭受严重的水分流失。

然而,木卫二背对木星一面的南北极,温度并不高,水分流失更温和。研究人员推测,那里或许能形成一层稀薄的水蒸气大气层。

在遥远的未来,木卫二也许会成为太阳系中任何剩余生命的家园。

言论

1、

有一种新的编码方式,我称之为"炒作编码"(hype coding),就是按照媒体炒作的方式,使用 AI 编程。

一边刷着抖音,一边让一大群 AI 为你编码。如果出错,就让 AI 再试一次,也不阅读它的输出,只把这些输出重新提交给 AI,直到运行成功。如果最后无法运行,那就等待下一个模型发布。

-- 《炒作编码》

2、

在机器大量生产平庸之作的这个时代,自己动手做点什么吧。让它不完美。让它粗糙。就这么去做。

-- 《这个时代,没人在乎你写了什么》

3、

一项研究称,养成一种新的生活习惯,平均需要66天,最长需要8个月。

-- 《欧洲社会心理学杂志》

4、

习惯使用 AI 大模型的下一代人,将不知道图书馆的用途。

-- Benjamin Breen

5、

我们生命中最美好的时刻,并非是那些接受给予、放松享受的时刻,而是那些为了完成一件困难而有价值的事情,自愿将身心发挥到极限的时刻。

---- 米哈里·契克森米哈赖,"心流"(flow)概念的提出者

往年回顾

最受欢迎的颜色(#304)

人生是一个长板问题(#254)

如何度过疫情、裁员、还有战争(#204)

1982年的信息社会预言(#154)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年6月 6日

科技爱好者周刊(第 350 期):Java 三十周年

作者 阮一峰
2025年5月30日 08:02

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

正在举行的第26届舟山国际沙雕节,主题是"海上音乐城"。海滩上50多座沙雕,组成了一把吉他。(via

Java 三十周年

上周是 Java 语言诞生三十周年。1995年5月23日,Sun 公司正式发布了这种语言。

三十年了,大家觉得 Java 算不算老语言?

说实话,我一直以为,Java 跟 C++ 是同一时期的语言。但是实际上,Java 与 Python、JavaScript、PHP 同时期,属于年富力强的年轻语言。

全世界的计算机语言有几千种,Java 是特别、特别成功的那一类。从发布的第一天起,它就很成功,一直保持到今天。

Java 的成功体现在两方面。

(1)它无所不在。日常生活中,我们接触到的软件服务,尤其是企业级服务,后端的开发语言大部分都是 Java。

Java 在服务端是霸主地位,在桌面端也有广泛应用,很多人用它写桌面软件。至于手机端,就更不用说了,安卓系统就基于 Java。

(2)它的工作岗位最多

如果你问我,学习什么编程语言,最容易找工作?

没有其他前提的情况下,我会建议学习 Java,它的工作岗位最多,最容易找。

Python 语言虽然也很热门,但是工作岗位往往要求高级程序员,中级和低级的岗位并不多。不像 Java,你只要具有一般水平,就可以去应聘,需要普通 Java 程序员的地方非常多。

国外有一条经验法则,叫做林迪效应(Lindy effect),说的是一种事物的预期寿命与它已经存在的时间成正比。它已经存在多久,你可以预期,它还会存在这么久。

那么,Java 已经流行了30年,接下来30年,很可能还会继续流行。

高斯林口述历史

Java 语言的发明人是高斯林(James Gosling,1955-)。他在 Sun 公司时,发明了 Java。

2019年,美国的计算机历史博物馆采访他,一连两天,每天三个小时,后来制作了一个节目《高斯林口述历史》(Oral History of James Gosling)。

网上有视频 + 文字稿(PDF ),他谈了很多东西。下面,我摘录跟 Java 有关的部分,非常有意思。

问:你什么时候开始研究字节码?

答:我在卡内基梅隆大学读研究生时,开始从事字节码方面的工作。

当时,我的导师要求我,将一些软件从一种计算机移植到另一种计算机。我不知道他怎么想的,移植软件非常困难。

但是我发现,写一个字节码到汇编代码的编译器却很容易,得到的代码质量比原生的 C 编译器还要好,能够顺利运行。

这件事让我记住了,只要生成软件的字节码,然后为不同平台写一个字节码到汇编语言的编译器,就能让软件在不同架构的计算机上运行。

问:你怎么在 Sun 公司开始搞 Java?

答:Sun 公司的产品是服务器,在消费电子领域错过了很多机会。

我们当时有一群人,核心小组大概只有四个人,想探索消费电子领域。首席执行官同意了,给了我们一笔钱,那时是1991年。

我们决定做一个原型设备,项目名叫 Star7。这个设备相当古怪,有点像后来的 iPad。事实上,我们团队后来有几个人,确实继续从事 iPad 的研发。

我们并不想做那种特定功能的设备,而是想要一个网络设备,可以跟其他设备相互通信,并进行远程控制。

我们设想的一个用途是,当时的电视和录像机都有各自的遥控器,我们想用一个设备同时遥控多种其他设备,不仅能够控制电视,还能控制灯光,并且可以互动。

当然,Star7 没有成功。但是过了30年,人们竟然还在打造这样的设备,感觉有点奇怪。

问:你怎么想到要为这个设备,发明一种新的编程语言?

答:我们最初的目标不是发明一种编程语言,但是我们意识到,很多问题都源于编程工具。

我们想改进一下 C 和 C++,让它们更适合我们的环境。我自愿承担了这项任务,因为我是小组里唯一一个之前开发过编译器的人。

随着时间的推移,我改动的部分越来越不像 C++ 了,开始像一种独立的语言。

问:这种语言最初命名为 Oak?

答:是的,它最初被命名为 Oak(橡树)。这纯粹是偷懒,我当时需要新建一个文件夹,存放代码。我坐在办公桌前,望着窗外,看到一棵橡树,就为文件夹起了这个名字。

问:一开始,该语言就被设计为独立于特定平台?

答:是的。平台独立性是我们从一开始就考虑的事情之一。

这其实来自那些消费电子公司,他们是这种语言的使用者。他们非常不乐意受制于特定供应商,如果某个供应商有问题,他们希望可以更换供应商。CPU 也是如此,他们不希望受制于特定的 CPU。

问题就来了:如何才能让他们轻松地从一种芯片切换到另一种呢?这不就是我在卡内基梅隆大学移植字节码时遇到的问题吗。

所以,新语言的核心特性就是字节码,这样才能轻松地针对不同的 CPU 指令集进行开发。

如果厂商要为某个芯片制造一些东西,比如下一代录像机或电视机,即使处理器架构发生变化,也不用重写大量代码。现有的代码可以有把握地在尚未发明的机器上运行。

问:Java 的口号"一次编写,随处运行"(Write once, run anywhere)是这样来的吗?

答:我完全不知道这句话是谁想出来的,它是公司的营销用语。这句话说得很棒,但把事情过分简化了。

问:Java 是什么时候从机顶盒转向互联网?

答:应该是94年或95年,我们决定放弃机顶盒。因为我们发现,大型媒体公司内心深处,并不想要一款强大的新设备,而是想要控制用户的眼球,多吸引广告商。

我们决定转向更广阔的领域,让新语言可以用在互联网开发。

问:Java 是怎么赢得软件开发商的?

答:我们发现,Java 与平台隔离的特性很有吸引力,它不关心你使用哪种浏览器,因此你可以把平台问题与应用程序的问题隔离开来。

我们不再以消费者和嵌入式为中心了,而是思考这种语言怎么帮助更广大的软件开发者。

如果你是一个软件开发者,你不必考虑在谁的平台上开发软件,Sun、微软的 Windows NT 或者惠普。如果你用 Java 开发,你可以把软件卖给使用不同平台的客户。

问:你们发现 Oak 被另一家公司占用后,才想到了 Java 这个名字?

答:是的。你要发布一款产品,必须给它起个名字。Oak 已经被其他公司注册成商标了,我们被迫选择一个新名字。

那时,我们已经准备好发布软件了,就是缺一个名字。我们组织了一场命名会议,询问大家的意见,列出一张大家感觉可以的单词列表,然后发给律师,让他们从上到下检查有没有商标问题,哪个单词第一个通过检查,我们就用那个。

问:Java 是第四个单词?

答:是的。我个人最喜欢的是排名第三的 Lyric,但它没通过检查。排名第一的单词,也就是项目组大多数人最喜欢的名字,是 Silk。我不喜欢这个词,觉得它有点吓人,让我想起了蜘蛛。尽管喜欢它的人说,它象征互联网。我忘了排名第二是什么词,但是第四是 Java,我们就用了它。

科技动态

(1)内蒙古一煤矿,实现了100台无人卡车的编组运行,操作人员仅仅6人。

注意,无人卡车的驾驶舱位置是电池。

(2)戴森公司创始人,发布世界最薄吸尘器,机身仅高95毫米。

(3)杭州举行人形机器人格斗赛

比赛机器人采用遥控操作。

(4)丹麦继日本之后,成为全世界第二个国家,将退休年龄提高到70岁。

(5)阿联酋成为全球首个国家,为全体公民和居民免费提供 ChatGPT Plus,该服务目前的月费为20美元。

文章

1、CAPTCHA 没用了(英文)

作者在一家票务网站工作。他提出,各种识别机器人的验证机制,要么可以被 AI 绕过,要么不适用于出票,难以找到有效的解决方案。

2、我的同步备份方案(英文)

作者的备份方案分成两部分。(1)使用开源软件 Syncthing 在多台电脑之间同步目录,(2)使用 TrueNAS 将本地内容同步到云存储。

3、Bash 脚本执行心跳测试的写法(英文)

本文教你一种简单的写法,使用 Bash 脚本执行心跳测试(验证服务器是否正常在线)。

4、虚拟主机加固指南(英文)

开通虚拟主机(VPS)后,应该如何设置,提高安全性,本文给出基本步骤。

5、自解释的代码(英文)

本文通过一个例子,演示应该怎么写,才能让代码清晰易懂,自己解释自己。

工具

1、Defuddle

一个 JS 库,从 HTML 网页代码提取内容,转成文本。

2、DockFlare

Cloudflare Tunnel 的开源管理工具。

如果内网有多个 Docker 容器,通过 Cloudflare Tunnel 向外网开放,DockFlare 可以对它们进行统一管理,参见介绍文章

3、f2

一个命令行的文件批量改名工具,功能较强,参见介绍文章

4、TypeID

唯一身份识别码 UUIDv7 的改进版,加上了类型前缀。

5、Starlight

基于 Astro 框架的文档网站生成工具。

6、ntfy.sh

消息推送工具,向手机和桌面电脑推送消息,可以自搭建,也可以使用官方服务器,参见介绍文章

7、BillionMail

开源的电子邮件营销平台,帮助企业和个人管理电子邮件营销活动,可以发送新闻通讯、促销邮件、消息。(@aaPanel 投稿)

8、Lynx Proxy

开源服务器,代理 HTTP/HTTPS 和 WebSocket 流量,内置 Web 管理界面。(@suxin2017 投稿)

9、Text to SVG

字体转 SVG 的工具网站,可以用来制作文字 Logo。(@JiuRanYa 投稿)

10、DualPiP

Chrome 插件,提供增强版的画中画播放器,支持主流视频网站一键弹出。(@ymlluo 投稿)

AI 相关

1、Smart Mermaid

将文本转为 Mermaid 格式的可视化图表,省去手动编写 Mermaid 代码。(@liujuntao123 投稿)

2、Folda-Scan

一个与代码库对话的 Web 应用,可以扫描本地文件夹,对其建立本地索引,从而用自然语言库对话。(@oldjs 投稿)

3、Ainee

AI 开源笔记工具,将音频、文字、文件以及 YouTube 视频等转换为笔记。(@luyu0279 投稿)

4、OpenDerisk

开源的 AI 运维助手,对线上系统提供 AI管家,与真人协同处理运维问题。(@csunny 投稿)

资源

1、周刊 AI 总结器

AI 提炼的每一期周刊重点内容,代码开源。(@ronething 投稿)

2、日本語文章解析器

日语句子分析的网站。(@cokice 投稿)

Computex 的奇特 PC

上周闭幕的台北 Computex 2025 电脑展,出现了很多奇特的 PC(来源12)。

1、招财进宝

你以为这是金元宝吗?错了它是一台电脑。

它的背后就是机箱,金元宝上方的流水装置就是循环的液冷。

2、变形金刚

这个变形金刚也是一台电脑,头部会旋转,眼睛会变色,还能播放语音。

它胸部发亮的地方,就是电源按钮。

腿部就是放置显卡的地方。

3、水族馆

这个水族馆是真正的海景房电脑,里面有水母和金鱼的饰品。

风扇的 RGB 灯效,做得像灯笼一样,晚上亮起来肯定很漂亮。

4、黄貂鱼

这台电脑模仿了黄貂鱼,但是又好像一架飞机。

它的两侧前翼,可以用胸前的齿轮,调节移动。

5、咖啡机

这个咖啡机机箱是概念产品,应该不能用来冲咖啡。

6、跑车

这台跑车机箱,显卡插在车尾,引擎盖下面是主板和散热风扇。

7、黑神话悟空

黑神话主题机箱,外面包了一层"牛王铠甲"。

8、河马

河马机箱走可爱路线,下面的水盆好像是标配。

9、茅草屋

茅草屋机箱无敌了,上面真的覆盖了一层稻草,放在家里可以做盆景了。

言论

1、

我从来不喜欢内容收费,我的所有写作和研究成果都免费发布,这带给我巨大的价值。

现在,我想尝试一种不一样的订阅:你付钱给我,我会少给你发送一些东西。

我会推出一份仅限赞助者的月度邮件,里面都是我精心选择的重点内容,你就不用每天看我的大量更新了。

-- Simon Willison,著名开发者

2、

AI 是比真人更好的老师,但是以后的学校还会需要真人老师,他们的主要职责是看管孩子。

-- 路易斯·冯·安 (Luis von Ahn) ,Duolingo 的首席执行官

3、

把 AI 当作工具,而不是拐杖,那些2019年时被认为有价值的基础工程技能,值得你继续投资。

-- 《不要让 AI 加速我们的无能》

4、

最有害的建议之一就是不要重新发明轮子。

这种建议会导致一种抑制好奇心和探索的氛围。现代生活的很多重要发明,都来自那些不听从这个建议的人们。

重新发明轮子就是一种学习,并且学习过程中,你可能会做出更好的版本。

-- 《重新发明轮子》

往年回顾

技术封建主义(#303)

训练材料用完之日(#253)

英国的名校签证,伯克利的计算机教育(#203)

机器翻译是对译者的侮辱吗?(#153)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月30日

科技爱好者周刊(第 349 期):神经网络算法的发明者

作者 阮一峰
2025年5月23日 08:12

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

北京的护城河公共绿道,位于鼓楼附近。(via visuals_china@instagram

神经网络算法的发明者

上周的《李飞飞自传》读后感,还有后续。

那篇文章的结尾是,2012年一支加拿大团队使用神经网络算法,夺得了 ImageNet 比赛冠军。

今天就来说说,这支加拿大团队的故事。

大家看了就知道了,神经网络算法是怎么诞生的,背后的推手又是谁。

(1)杰弗里·辛顿(Geoffrey Hinton,1947-)

辛顿出生于英国,后移居加拿大。他是神经网络算法的奠基人和主要发明者。

神经网络的概念,是上世纪40年代后期提出的(提出人不是辛顿)。当时的想法是,既然人类通过神经网络进行思考,那么只要让机器模拟神经网络,机器就能思考了。

但是,那只是一个概念,并没有具体的算法。机器怎么模拟思考,人们并不知道。

1984年,辛顿在加州大学担任博士后,与两个同事一起提出了反向传播算法。

这个算法可以建立多层网络,产生一个输出结果,让神经网络变成了现实,也是后来更高级算法的基础。

由于它需要多层计算,后一层在前一层的结果上学习,所以被称为"深度学习",辛顿因此成为"深度学习之父"。

辛顿后来因为这个贡献,获得了图灵奖(2018年)和诺贝尔物理学奖(2024年)。

(2)杨立昆(1960-)

杨·安德烈·勒坎(Yann André Le Cun,中文名杨立昆)是法国人。上个世纪80年代,他是多伦多大学博士后。

这一时期,辛顿也来到了多伦多大学任教,担任他的指导教师。

所以,杨立昆是辛顿的大弟子,继承和发展了辛顿的算法。他的主要成就是,为神经网络引入了卷积算法,并且做出了第一个有实际用途的神经网络。

1990年代,他用神经网络识别银行支票的手写数字,成功获得了企业的采用。

但是,这个应用也暴露了卷积神经网络的弱点:它需要大量样本的训练,耗费巨大的算力。银行支票只需要识别10个阿拉伯数字,如果是更多样化的场景,当时的计算能力难以做到。

学术界因此认为,卷积神经网络只适用特定的、计算量较小的场景,不具备推广的价值。这导致这种算法,以及辛顿和杨立昆,被冷落了二十年。

这二十年,杨立昆一直混迹于企业实验室和大学教研室。等到世界重新认识卷积神经网络,他在2018年与辛顿一起获得了图灵奖,现在是 Meta 公司的副总裁和 AI 首席科学家。

(3)亚历克斯·克里泽夫斯基(Alex Krizhevsky,1986-)

亚历克斯·克里泽夫斯基是乌克兰人,少年时随家人移民到加拿大。2007年,他进入多伦多大学,成为辛顿的博士生。

这时距离杨立昆提出卷积神经网络,已经过去快20年了。辛顿始终没忘记它,他鼓励亚历克斯和稍后要提到的伊尔亚·苏茨克维,使用这种算法,去挑战李飞飞的 ImageNet。

亚历克斯就写了一个程序,用 ImageNet 的1500万图片,来训练他的卷积神经网络。但是,计算量太大了,他的个人计算机根本跑不动,他就买了两块 Nvidia 显卡,每天24小时一刻不停地运算。

事实证明,卷积神经网络+大训练集+高速计算硬件,超过了其他一切已知的算法。最终,他们的三人团队以巨大优势,夺得了2012年第三届 ImageNet 算法比赛冠军。

这件事轰动了业界,各大互联网公司纷纷邀请辛顿和他的学生加入。百度也伸出橄榄枝,邀请辛顿担任首席科学家,但是最后输给了谷歌。

2013年,谷歌以4400万美元收购了辛顿成立的空壳公司,将辛顿、亚历克斯、伊尔亚三个人一起招入麾下。

2017年,亚历克斯辞职,现在一家创业公司研究 AI 技术。

(4)伊尔亚·苏茨克维(Ilya Sutskever, 1986-)

伊尔亚·苏茨克维出生于前苏联,后去了以色列,然后来到加拿大。他是亚历克斯·克里泽夫斯基在多伦多大学的博士同学,也是辛顿的博士生。

他与亚历克斯组成团队,共同赢得了2012年的 ImageNet 算法比赛。辛顿作为指导老师,也是团队一员。

他在2013年跟随辛顿加入谷歌,2015年辞职,成为 OpenAI 的联合创始人和首席科学家,后来是 ChatGPT 的主要作者之一。2024年,他离开 OpenAI,现在创立了自己的 AI 公司。

(5)安德烈·卡帕斯(Andrej Karpathy,1986-)

安德烈·卡帕斯出生于斯洛伐克,15岁随家人来到加拿大,在多伦多大学读完了本科。

他跟伊尔亚·苏茨克维很可能大学里就认识。但是,他没在多伦多大学读博士,而是去了斯坦福大学,指导老师就是李飞飞。

他的方向也是卷积神经网络,博士期间开设了斯坦福大学第一门深度学习课程,担任主讲。

2015年,他跟随伊尔亚一起加入 OpenAI,成为主要研究人员。

2017年,他离开 OpenAI,去了特斯拉,担任特斯拉 AI 总监,2022年离职。

(6) 总结

上面五人是神经网络算法的主要创立者和推动者。没有他们,就不会有今天的 AI 大模型。

但是,单单靠他们的算法,AI 不会成功。因为算法需要大量的数据进行训练,而训练需要高速计算的硬件。这三者缺一不可。

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

历史于是翻开了新的一页,AI 时代正式来临。

科技动态

(1)一家深圳公司推出了,可能最炫酷的树莓派机箱

它自带机箱显示屏、RGB 灯光、风扇、NVMe SSD 扩展板,很适合用作 NAS 和 AI 边缘计算。

(2)芬兰尝试在驯鹿的鹿角,涂上荧光粉。

这是为了方便司机在夜间看到驯鹿,目前每年在芬兰公路上被撞死的驯鹿有4000头。

(3)在线会议软件 Google Meet,推出实时语音翻译,首先提供西班牙语版本。

在线会议时,对方说西班牙语,你听到的却是英语,而且声音、语调和情感‌都不变。

(4)意大利开源硬件公司 Arduino,研发出了可降解 PCB(电路板),减轻对环境的污染。

这种可降解电路板,将电路印刷在植物亚麻材料上,而不是传统的玻璃纤维和树脂。

不过,电路板上的铜无法降解,需要在丢弃电路板之前先回收。

(5)一家美国创业公司,准备发射卫星,将 AI 机房建在太空

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。

文章

1、手机的 Linux 桌面环境(英文)

作者出门不带笔记本,只带手机,再配上蓝牙键盘和 AR 眼镜。

他的安卓手机在获取 root 权限后,通过 chroot 安装了 Linux 发行版,从而可以运行桌面环境。

2、AI 应用的核心逻辑(英文)

作者提出,AI 应用(AI agent)的核心逻辑只需要9行代码。

3、浏览器默认屏蔽的端口(英文)

你可能不知道,浏览器无法打开下面的网址localhost:6000,原因是6000是浏览器默认屏蔽的端口。

4、推荐 RustDesk 远程桌面(英文)

Mac 电脑访问 Windows 电脑,一种方法就是使用远程桌面,作者推荐远程桌面工具 RustDesk。

5、HTML <dialog> 的 CSS 技巧(英文)

HTML 有一个原生的弹窗元素<dialog>,本文介绍两个配套使用的 CSS 技巧。

6、Git 配置详解(英文)

本文详细解释 Git 配置命令 git config 的几个最常见的设置。

工具

1、Pyrefly

Meta 公司发布的 Python 代码的类型检查器,参见介绍文章

2、Zen Browser

新发布的一个开源浏览器,基于 Firefox,国外评价非常高,使用体验好,参见介绍文章

3、xtool

Xcode 的替代品,在 Linux/Win/macOS 开发 iOS 应用。

4、Zero Convert

在线批量转换文件,基于 WebAssembly 技术,完全本地完成,还可以编辑图片。(@xiaoshangmin 投稿)

5、耗子面板

Go 语言开发的服务器管理面板。(@devhaozi 投稿)

6、Goravel

Go 语言的 Web 开发框架,与 PHP 的 Laravel 框架保持一致,方便快速上手。(@devhaozi 投稿)

7、OpenSpeedy

开源的游戏变速工具,通过调整 Windows 系统时间函数来实现游戏速度变化。(@game1024 投稿)

8、SimonAKing-Gallery

后端的 JS 相册应用,瀑布流展示图片,指定图片目录,直接运行即可。(@SimonAKing 投稿)

9、Jwno

网友开源的 Windows 10/11 平铺窗口管理器,键盘驱动。(@agent-kilo 投稿)

10、星河小程序

滴滴公司开源的跨平台开发框架,支持将小程序打包成为安卓、iOS、鸿蒙和 Web 四个平台的原生 App。(@dos1in 投稿)

AI 相关

1、aTrain

一个跨平台、图形界面的自动语音识别工具,基于 Whisper 模型,支持识别50多种语言,参见介绍文章

2、AI Image Editor

在线的免费图像处理工具,提供多种 AI 功能,比如图片增强、去除水印、风格转换等十几种。(@worminone 投稿)

资源

1、万物博物馆

一个跨平台的桌面软件,将维基百科变成一个虚拟博物馆。

每件展品与维基百科的一篇文章相对应,墙上的画框就是文章图片,讲解牌就是文章内容。

走廊则根据文章的链接通向其他展厅,有几乎无限的展厅可以参观。

图片

1、《星球大战》的机器人

《星球大战》的第一部电影,拍摄于1976年,里面有一个机器人 R2-D2,会四处走动,做各种动作,还会说话。

其实,它根本没那么高科技,拍摄的时候,就是里面藏了一个真人演员。

2、冰为什么体积大?

水变成冰以后,体积会增大10%,密度因此小于水,使得冰可以浮在水面上。

那么,冰的体积为什么会增大呢?

答案是冰的分子结构,跟水的分子结构不一样。

上图左侧是液态水的分子结构,右侧是冰的分子结构。其中,白色节点为氢原子,红色节点为氧原子。

可以看到,液态水是紧密聚合的网络结构,冰则是中空的网络结构。也就是说,冰的分子结构不是那么密合,所以体积就变大了。

文摘

1、Slack 公司的 URL

Slack 是一家即时通信的软件公司。它的官网有一个"公司介绍"的页面,通常来说该页面的 URL 会是slack.com/about,但是 Slack 没有采用这种做法。

它将这个页面命名为is,并分拆成若干个子页面。

所以,"公司介绍"页面的 URL 是slack.com/is

子页面的 URL 如下。

  • slack.com/is/team-communication
  • slack.com/is/everything-in-one-place
  • slack.com/is/wherever-you-are

这样的好处是单单看 URL,就知道页面想要传递的信息,URL 本身就是对公司的一种宣传。

这种 is 的巧妙做法,后来被广泛借鉴。碰巧的是,is也正好是一个顶级域名,代表冰岛(iceland)。很多名人就申请了 is 域名,作为个人主页。

比如,艺术家杰西卡·希斯切(Jessica Hische)的个人网站,域名就是jessicahische.is,她介绍自己的页面 URL 就都是jessicahische.is/xxx的形式。

言论

1、

我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。

-- Sam Altman,OpenAI 的 CEO

2、

加尔定律经常被引用:"一个有效的复杂系统,总是从一个有效的简单系统进化而来。"

但是,它的推论很少被引用:"一个从零开始设计的复杂系统永远不会有效,你必须从一个可以运行的简单系统开始。"

-- Stack Staves

3、

宇宙有两种可能:要么我们是孤独的,要么我们并不孤独。这两种可能性都同样令人恐惧。

-- 阿瑟·克拉克,英国著名科幻小说家

4、

太阳绕银河系公转一圈需要2.3亿年,上一圈的时候,地球的主宰还是恐龙。

-- Reddit 网友

5、

我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

最终可能会出现这样一代人,自己的智力很低下,完全依赖于他们不理解的技术,一旦技术崩溃,他们永远无法从头开始重建。

-- 尼尔·斯蒂芬森(Neal Stephenson),美国科幻小说家,"元宇宙"一词的创造者

往年回顾

创业虽然好,不敢推荐了(#302)

互联网创业变难了(#252)

三个有启发的学习方法(#202)

从北大到技校(#152)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月23日

科技爱好者周刊(第 348 期):李飞飞,从移民到 AI 明星

作者 阮一峰
2025年5月16日 08:05

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

5月1日,宇宙飞船造型的深圳科技馆新馆开馆,上图是设计团队在新馆前合影。(via

李飞飞,从移民到 AI 明星

大家知道李飞飞吧,AI 的明星教授。

她在斯坦福大学任教,是美国国家工程院等三院院士,担任过斯坦福 AI 实验室主任,以及谷歌云 AI 首席科学家。

她1976年出生于北京,在成都长大,16岁全家移民美国。

我一直好奇,她怎么走上 AI 这条路,从移民变成学术明星?

这几天,我读完她的自传《我看见的世界》(中信出版集团,2024),才发现她的人生很有戏剧性,每当重要关头,都有幸运的事情发生

(1)高中阶段

她出生于一个普通家庭,中学阶段并无过人之处。

我们家位于成都当时的外环路旁边,小区由三栋一模一样的塔楼组成,我家住在四楼。这个环路是不断扩张的城市边缘,一侧是工厂,另一侧是农田。

我进入了一所吸引全市优秀学生的中学。在那几年里,对女孩的预设和偏见让我越来越不耐烦,这种情绪已经超出了课业的范围。在同龄人中,我已经有"假小子"的称号。

1992年,移民美国后,她家的生活顿时变得困难。一家三口挤在新泽西乡下一间一居室公寓,她睡客厅,床就放在餐桌旁边。

父亲在一家华人商店修理旧相机,后来被辞退,从此失业。母亲做杂货店营业员,后因风湿性心脏病,回家休养。李飞飞下课后,就要去打工,有时在中餐馆端盘子12个小时,每小时2美元。

最后,实在走投无路,她们家决定买下社区的一家干洗店,靠洗衣为生。买下干洗店需要10万美元,全家仅有2万美元储蓄,其余8万美元都是借的。

(2)大学阶段

1997年,李飞飞中学毕业,要申请大学了。

一开始,我的目标大学主要是州立大学和社区大学,而不是常春藤学校。但我一直对一所顶级高校念念不忘,那就是普林斯顿大学。

我们是一个靠从车库市场淘来的旧货才能勉强度日的家庭,连我用的计算器都是坏的,我们怎么可能负担得起常春藤学校的学费呢?

尽管如此,我还是无法抑制内心的冲动,提交了申请。就算只是象征性地申请一下,我也感觉具有特殊意义。

她申请了普林斯顿大学,结果好梦成真,普林斯顿给了全额奖学金。

如果没有全奖,以她家的经济状况,负担不了学费。如果不去普林斯顿大学,她就不太可能走上学术道路了,更不要说后面的成就了。

(3)博士阶段

大学毕业后,李飞飞原想去华尔街工作,解决家庭的经济问题。

母亲鼓励她,继续追求自己的梦想。于是,她选择去加州理工学院读研究生,方向是视觉识别机制。

2004年,李飞飞为了写博士论文,需要图片材料,来训练算法。她找了9000张图片,组成了一个图片集,手工对每张图片进行分类标注,一共分成101类。

这个图片集叫做 Caltech 101,算法经过训练,就能从新图片识别出这101类物品。她因此顺利拿到了博士学位。

(4)助教阶段

博士毕业后,李飞飞先去伊利诺伊大学,后去普林斯顿大学,都是担任计算机科学的助教。

她继续探索视觉识别,想找到一种通用算法,能够识别所有种类的物品,而不是 Caltech 101 那样,只能识别出101类物品。

这意味着她需要一个超大的图片训练集,能够包含了世界上所有物品。这可太难了,所有人都反对这件事。

我们都是年轻的助理教授,所处的院系竞争激烈,在事业起步的那几年里,我们都面临着"要么发表论文,要么完蛋走人"的局面。压力之下,我们必须马不停蹄、保质保量地完成工作,因为我们知道,稍有懈怠就可能与终身教授的职位说再见,一同失去的还有获得稳定生计的最佳机会。

我听到的劝阻之声已经多得够我用一辈子了(可能下辈子也够了).

有上万个类别的数据集有什么用?大部分模型连一两个类别都识别不准!

你知道用这么多图像训练一个模型要花多长时间吗?这个时间可是用"年"来计算的。

别人要怎么下载呢?你这个图像总量比大多数硬盘的存储量还要大。

具体怎么做,你有计划了吗?几百万张图谁来做标注?要花多长时间?怎么验证所有内容的准确性呢?

(5)ImageNet

李飞飞坚持要做,这个通用图片集起名为 ImageNet。那时是2006年。

她想到一个思路,英语词典有一些基本名词,用来解释其他所有物品。只要统计一下,基本名词有多少个,每一个又有多少变体,那就得到了所有物品的基本类别。

统计结果是3万类。因此,李飞飞估计,ImageNet 将有3万个类别,总共包含2000万张图片,每张图片都要有分类和标注,需要从几亿张图片里面筛选出来。

我们发出了邮件,招募愿意帮忙从网上下载和标注图片的本科生,工作时间灵活,每小时10美元。我们招募到一些学生,但是按照这样的进度,完成整个项目需要19年。

这太慢了,项目方法做了改进,用脚本自动去谷歌搜索图片,然后抓取。但是这样也需要人工核对和筛选,只把19年的时间缩短到18年。

幸运的是,亚马逊刚刚发布了众包平台"土耳其机器人"(Amazon Mechanical Turk,AMT)。在这个平台上,你可以出钱,通过互联网,把任务分包给世界各地接活的人。

他们通过这个平台,将 ImageNet 分包出去,投入的人数一下子扩展到几千人,而人均费用只是原来的几十分之一。

2009年6月,ImageNet 的初始版本终于完成了。我们成功达成了目标:收集了1500万张图片,涵盖了2.2万个不同类别。这些图片筛选自近10亿张候选图片,并由来自167个国家的4.8万多名全球贡献者进行了标注。

(6)ILSVRC 算法竞赛

ImageNet 虽然完成了,但在学术界毫无反响,没有太多人关注。

我们遇到了第一个也是最严重的挫折:在当年的"计算机视觉与模式识别大会"上,ImageNet 被降级为"海报展示"。

所谓的"海报展示"是一个学术术语,意味着我们将不能在演讲厅内向听众展示我们的工作,只能在会场的指定区域里摆放一幅印有项目摘要的大幅海报,希望能引起路人的兴趣。

我想过 ImageNet 可能被证明是对的,也可能被证明是错的,对于这两种可能性,我都做好了准备。无论是哪种结果,都会是一个学习的机会。然而,我万万没想到,它被忽视了。

由于 ImageNet 得不到承认,李飞飞想到一个办法,她要每年举行一次算法比赛,看看哪种算法识别 ImageNet 图片集的正确率最高。

这样一来,在计算机视觉领域,ImageNet 就会成为一个比较基准,各种算法都需要用它表示自己的识别能力,大家就不会忽视它了。这个比赛叫做 ILSVRC(ImageNet 大型视觉识别挑战赛,ImageNet Large Scale Visual Recognition Challenge)。

2010年,第一届比赛令人失望,11个团队提交了35个参赛算法。冠军算法是传统的图片向量比较,并无创新之处,正确率也不高。

2011年,第二届比赛更惨,获胜算法还是图片向量比较,正确率只提高了2个百分点。这意味着,没有任何创新和进展。

最糟糕的是,参赛人数也出现急剧下降,参赛算法从35个减少到15个,愿意为此付出努力的人似乎越来越少。

说这种经历"让人羞愧"已经远远不足以描述我们的心情了。为了推动 ImageNet 的发展,我们倾注了多年的心血,搜集的图片数量远远超过以往的任何数据集,还精心策划了一场国际竞赛来探索它的能力,但结果却只是简单地重复了现状。如果说ImageNet 是一场赌注,是时候开始思考我们是不是已经输了。

眼看这个项目就要失败了,几年的心血付之东流。就在这个时候,李飞飞人生最大的惊喜和反转来临了。

2012年,第三届比赛,一个加拿大团队使用被学术界遗忘已久的卷积神经网络,一举将图片识别正确率提高了10%。

接下来的事情,就是被写进教科书的历史了。全世界被神经网络的效果轰动了,AI 研究出现突破,人类进入 AI 时代。

李飞飞彻底翻身,一举成名,从助教变成世界知名的 AI 研究领头人物,人生从此海阔天空。

她的故事令人感叹,如果神经网络算法没有在2012年出现,而是再晚几年,或者更早一点,亚马逊的土耳其机器人众包平台没有在2005年诞生,一切会怎样?

这就是时运吧。科学家的人生和科学发现一样,都是由一些偶然事件推动的。个人奋斗固然重要,但是关键时刻还是离不开幸运。

科技动态

(1)传统的脑电图,需要在头上布满电极(下图),有很多限制,也不舒适。

美国宾州大学的科学家,发明了一种头发电极,细得像头发一样,可以直接粘在皮肤上,淋浴和运动也不会掉下。

这种电极目前还是有线的,但是有计划开发无线版本。

(2)百度地图在导航路面植入广告。

(3)谷歌的 AI 笔记应用 NotebookLM,可能很快就会添加"视频概览"功能。

它已经支持生成音频和 AI 问答,如果再支持生成视频,简直难以想象,是否还需要真人老师。

直接上传课本,它就生成讲课视频了。

(4)安卓官方的桌面模式,泄露了运行照片。下图是它的多窗口模式。

但是 Android 16 可能来不及,发布要等到 Android 17。

手机当作桌面电脑,已经不远了。

(5)百度公布"动物语言转换方法、装置、电子设备及存储介质"专利,使用 AI 识别动物的情感状态,转换为人类能够理解的语言,从而实现动物与人类之间的情感交流和理解。

文章

1、一段让 Chromium 机器人崩溃的代码(英文)

作者介绍了一段 JS 代码,让Chromium 无头浏览器(Puppeteer 和 Playwright)崩溃。它可以用来识别,访问者是不是机器人。

2、Git worktree 简介(英文)

Git 仓库同时只能有一个工作区,如果想同时建立多个工作区,可以使用 git worktree 命令。

3、用 Go 移植 TypeScript 的重要影响(中文)

微软官方要用 Go 语言重写 TypeScript 项目,本文分析这样做的目的和影响。(@imbant 投稿)

4、为什么大模型可以控制手机(中文)

开源项目 droidrun 可以通过大模型,以自然语言操作安卓手机的 APP。本文分析它是如何做到的。(@lezhi12 投稿)

5、创业公司可能无法承受微服务(英文)

本文提出,微服务需要很强的运维能力,并会增加代码复杂性,创业公司不要盲目采用,单体应用更简单。

6、从 Prettier 和 ESLint 迁移到 BiomeJS(英文)

BiomeJS 是用 Rust 语言写的工具,对 JS 代码进行格式化和语法检查,速度极快,可以取代 Prettier 和 ESLint。

7、如何自己托管 Obsidian(英文)

Obsidian 是一个优秀的笔记软件,作者给出详细步骤,自己托管 Obsidian 服务器,从而在任何地方都可以通过浏览器使用。

工具

1、Void

开源的 AI 代码编辑器,Cursor 的替代品,基于 VS Code。

2、Hyvector

在线的矢量图(SVG 文件)编辑工具。

3、Karakeep

一个自搭建的书签 App,提供全文搜索和 AI 自动分类标签,参见介绍文章

4、PairDrop

局域网传输文件的 Web 应用,代码开源,类似于 ShareDropLocalSend

5、zVault

NAS 操作系统 TrueNAS 原本基于 FreeBSD,正在转向 Linux。zVault 是一个社区的分支,由社区推动继续在 FreeBSD 开发。

6、YAMLResume

使用 YAML 格式创建简历,并通过 LaTeX 输出 PDF,方便进行版本管理。(@xiaohanyu 投稿)

7、AllinSSL

开源的 SSL 证书自动化管理平台,集证书申请、管理、部署和监控于一体。(@KincaidYang 投稿)

8、Basecoat

一套基于 Shadcn UI 的组件库,但是不使用 React。

9、Scraperr

网络爬虫的 Web 控制台。

AI 相关

1、MathModelAgent

开源的 AI 应用,自动完成数学建模,生成一份完整的论文。(@jihe520 投稿)

2、BiliFilter

基于本地大模型的 Bilibili 弹幕过滤器,对弹幕分类过滤。(@ddddng 投稿)

3、AI 语音克隆

免费的语音克隆工具,3 秒录音克隆人声。(@xiaodaidai0701 投稿)

资源

1、I Don't Have Spotify

一个音乐搜索引擎,输入 Spotify、YouTube、Apple、SoundCloud 的音乐链接,它会提供该音乐在其他网站的链接。

2、IPinfo Lite

地理位置数据库 IPinfo 推出的免费服务,IP 查询地理位置,无需信用卡,API 请求次数不受限制。

1、Web Component 教程

英文的 Web Component 入门教程。

图片

1、数字键盘的样式

数字键盘来源于电话。

早期的电话都采用旋转的拨号盘。20世纪50年代,电话可以长途直拨了,拨打长途电话需要输入11个号码,拨号盘就太麻烦了,导致了数字键盘的诞生。

1955年,AT&T 公司的研究人员,做过一个研究,10个数字的小键盘应该怎样排列,效率最高?

他们一共列出了15种排列。

经过研究和比较,用户更喜欢从左到右、从上到下的布局。

具体来说,两排五列水平布局与现在普遍使用的 3x3+1 布局速度相当,差异很小。

AT&T 公司最终为电话选择了 3x3+1 布局,主要原因大概是它比较紧凑。

文摘

1、我第一次加入创业公司的教训

一位开发者大学毕业后,加入了一家创业公司。

他逐渐发现,公司内部有很多矛盾,产品决策也有失误。

最终,公司开始走下坡路,他就提交了辞呈,放弃了自己的期权。

离职后,他写了一篇文章,总结了自己得到的教训。

(1)即使创业公司的每个员工都很有动力,但如果创始人并非顶尖人才,那么取得巨大成功的机会很低(但你仍然可以从中学到很多东西)。

(2)创业公司只有两种工作:开发和销售。如果创始人既不做开发,也不做销售,不知道他在做什么,那就相信你的直觉吧。

(3)创业公司的产品还未得到市场验证的情况下,为多个平台构建原生应用,是一种极其低效的行为。如果同时为两个产品在每个平台开发两个原生应用,简直是疯了。

(4)创业公司的路演,大多是浪费时间。产品的验证来自于与用户交流和迭代,而不是打动评委。

(5)没有什么比并肩作战、共同实现梦想更神奇的了。如果你经常见不到创始人,所有的沟通都只能通过远程进行,那可不是好兆头。

(6)如果创业公司没有经过严格的面试,就录用了你,这是一个危险信号。他们到底是基于能力来录用你,还是因为你是第一个同意只收很少的报酬,就为他们工作的工程师?

言论

1、

科学项目日益大型化和制度化,使得个人的好奇心和创新,对于科学的推动正在减弱。科学的进步越来越依靠有效的组织和大量的投入。

-- 《思想家和实干家》

2、

除非你参与过历史遗留项目,否则你不能自称高级工程师。

-- infobip.com

3、

是什么让硅谷的公司如此强大?

不仅仅是它们数十亿美元的资金或数十亿用户,也不仅仅是因为它们拥有惊人计算能力和数据储备,让学术实验室的资源相形见绌。它们之所以强大,是因为成千上万个才华横溢的人在同一个屋檐下共同努力。

-- 《李飞飞自传》

4、

以前的小团队是1名高级开发人员 + 5名初级开发人员,以后是1名高级开发人员 + AI 大模型。

-- Hacker News 读者

5、

我打赌,以后的工程师必须深入底层,更接近硅片的层面。开发应用程序将不再需要精通技术的人,AI 让每个人都可以开发自己的应用程序。

-- Hacker News 读者

往年回顾

OpenAI 的图书馆工位(#301)

国产单板机值得推荐(#251)

中国需要成立半导体部(#201)

NFT 是什么,听说能赚钱(#151)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月16日

科技爱好者周刊(第 347 期):冷启动的破解之道

作者 阮一峰
2025年5月9日 08:09

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

烟台的"耕海1号"海洋牧场,是一个大型的网箱养鱼基地,同时也是海上休闲观光平台。(via

冷启动的破解之道

新软件有一个超级难题,就是发布的时候,没有用户

这叫做"冷启动",比喻汽车在冬季发动,天寒地冻,很难点火成功。

我最近读了一本书,专门研究这个问题,新软件怎么才能有用户?

书名就叫《冷启动问题》(The cold start problem)。

它的作者是安德鲁·陈(Andrew Chen),美国著名的风险投资家。

他自己创业过,也做过高管,还投了很多创业公司。

他觉得,冷启动是创业公司的头号难题。做出产品不难,找到用户才难。

只有解决冷启动,用户不断增长,项目才能生存和发展。

这本书的有些论断,让我感到很有意思,跟大家分享。

第一点,他提出,解决冷启动,要靠网络效应

什么是网络效应?就是通过人与人的连接,增加产品粘性,吸引并留住用户。

最好的例子就是电话。电话也是冷启动,早期只能跟一个固定对象通话,就像对讲机,想用的人很少。

只有组成电话网,它才变得真正流行。入网的用户越多,越能留住用户。

说白了,网络效应就是你的产品要有这样一个功能,能让用户之间产生连接。

第二点,新产品发布的时候,最好自带一个"原子网络"

原子网络就是最小用户网络,以最少的用户数量,让网络功能生效。

你找亲戚朋友也好,花钱拉人也好,总之要组成一个原子网络,让新用户一进来,就能感受到一个已经生效的用户网络。

第三点,原子网络的大小,根据产品不同而不同。经验法则是,原子网络应该让新用户可以坚持使用3分钟

如果低于3分钟,就表示网络功能太弱,可能不足以留住人。

(1)Uber:网约车的原子网络应该包含15-20辆车,让用户能在3分钟内叫到车。

(2)Airbnb:民宿的原子网络应该包含300套房子,也就是300个房东,供用户挑选。

(3)reddit:社区平台的原子网络应该有1000个子频道,让不同的用户都能找到感兴趣的频道。

(4)Slack:讨论群组的原子网络应该有3个人,并已经产生了至少2000条消息。

第四点,有些产品只是单纯的工具,不具备人际网络属性,怎么办?安德鲁·陈认为,如果产品没有网络属性,就要加上

用户为工具而来,为网络而留。

Instagram 最早只是一个照片滤镜 App,根本留不住用户,人们用了几次就走了。

后来,它转型成照片分享网络,添加订阅机制,让你订阅其他人的照片,一打开就看到好友的照片流。

这个变动让 Instagram 上线 18 个月后,被 Facebook 以10亿美元收购。

其他例子还有,Yelp 最初是一个本地商家的目录工具,后来变成了商家评价网络。LinkedIn 最初是一个在线简历工具,后来变成了职业人脉网络。

总之,你想要网络效应,就必须变成网络。

第五点,只要(一个细分市场的)用户网络达到2万人,就能自己不断变大,最终覆盖整个市场。

也就是说,2万用户是单一市场的阈值,突破这个数量,就渡过了冷启动。

万「友」引力计划:7天倒计时

字节旗下的 AI 原生 IDE---- Trae,最近有大动作。

它发了新版本,正式支持 MCP 服务器,并且大模型免费用,比如 Doubao、DeepSeek、Claude、Gemini、GPT-4o 都不收费(海外模型需要 Trae 海外版)。

为了让更多同学尝试 AI 编程,它推出了 万「友」引力计划。活动在五一前就开始了,现在是最后7天倒计时

活动规则很简单:轻松完成任务,赢积分,兑礼品

(1)安装 Trae,连续两天使用一次 AI 功能,就可兑换网易云音乐或 qq 音乐会员。

(2)邀请有礼:成功邀请 1 位好友下载并使用 Trae,就可获得积分,邀请越多,奖励越多,有华为 MatePad Air、雷蛇机械键盘、京东购物卡等。

机会难得,既可以学习 AI 编程,又能拿奖品,大家不要错过哦。

扫码上方海报,或者点击这个链接,了解活动详情。最后7天了,转发活动,找技术搭子,一起来参与。

科技动态

(1)Meta 推出了新应用 Meta AI,跟 ChatGPT 竞争,底层是 Llama 4 模型。

它的一个亮点是,可以控制 Meat 的智能眼镜,允许你从眼镜上调用 AI。

(2)一支法国研究团队,准备把鲈鱼胚胎(下图)送上月球,检验月球养鱼的可行性。

他们的想法是,月球上最容易活的植物是藻类,鱼食用藻,人食用鱼,从而解决宇航员的食物问题。

(3)一家中国照明公司推出了"AI 台灯"。

它有一个手机 App,用户对着手机说出场景("我正在看电视"),AI 会自动调节灯光模式,并给出备选模式。

(4)华硕的 RTX 50 显卡,被发现配备了陀螺仪和加速度计。

现在的显卡越来越重,突破了2公斤,插在机箱里,几乎必然发生倾斜或下压。这些传感器能够立刻发现,发出警报。

(5)美国建造了世界第一家 3D 打印的星巴克

3D 打印建筑的成本低,工期短,可以快速复制,很适合临时性建筑。

(6)欧盟规定,2027年开始,交易商不得提供加密货币的匿名账户,即必须实名交易。

文章

1、ChatGPT o3 可以识别照片拍摄地(英文)

如果你给 o3 模型一张照片,问它这是哪里拍的,它会猜得相当准确。

举例来说,上图是加州海边的某个村庄。因为 o3 用街景地图训练过,如果碰巧你也在这个位置拍摄,它会给出极准确的位置(这是坐在xx咖啡馆,对着窗外拍摄的)。

还有一篇相关文章,人类的专业级选手(下图)与 o3 比赛,谁猜地点更准,里面有各种实例。

这件事告诉我们,AI 时代上传照片必须非常小心,你会透露自己的位置。

2、Deno 的衰落(英文)

作者认为,Deno 作为一种 JavaScript 的运行环境,最近出现了很多问题,业务在收缩,前景不乐观。

3、如何命令行设置新 MacBook(英文)

macOS 内置了一些命令行工具,可以快速设置系统,非常适合用来配置新电脑。

4、使用 Zip 炸弹保护服务器(英文)

作者痛恨网络爬虫,决定使用 Zip 炸弹对付它们。

zip 炸弹就是一个体积很小的压缩文件,但是解压后却极其巨大(比如 10GB)。

5、Astro 框架的架构(英文)

著名程序员 Dan Abramov 解释 Astro 框架的设计思想,以及它与 React 的服务器组件的差异。

工具

1、BongoCat

一款开源的桌面宠物,支持 macOS、Windows 和 Linux。(@ayangweb 投稿)

2、Barcode Maker

开源的条形码和二维码生成网站。(@LeonZeng919 投稿)

3、Fread

开源的"微博客"安卓客户端,同时支持 Mastodon、Bluesky、RSS 三种协议。(@0xZhangKe 投稿)

4、DeckTap

局域网的演示遥控器,在电脑上运行它,手机连上电脑,就能无线遥控幻灯片演示。(@Rico00121 投稿)

5、Input Source Pro

Mac 电脑的开源小工具,方便切换输入法,可以指定不同应用/网站的默认输入法。(@runjuu 投稿)

6、QBin

开源的在线文本编辑与分享服务,可以用作个人的文本、代码、图片、视频分享网站。(@kfcx 投稿)

7、EasyEditor

开源的低代码引擎,用于可视化搭建 Web 应用。(@JinSooo 投稿)

8、PakePlus

一款桌面应用,使用 Tauri2 将任意网站打包成桌面应用和手机应用。(@Sjj1024 投稿)

9、柠檬表单

开源的表单问卷系统,类似于金数据和飞书问卷,自带管理后台。(@bojue 投稿)

10、MotionEaseTune

一个安卓应用,通过播放 100Hz 声音来预防晕车,项目开源。(@BHznJNs 投稿)

11、OpenApi 接口代码生成器

一个命令行工具,根据 OpenAPI (swagger)文档,生成各种编程语言的客户端接口代码。(@otk-final 投稿)

12、MyOCR

一个基于 Python 的本地 OCR(文字识别)框架。(@robbyzhao76 投稿)

13、SimonAKing-HomePage

一个使用 WebGL 流体动画的个人网站模版。(@SimonAKing 投稿)

14、酷监控

开源的监控(网站/接口/HTTPS 证书)控制台,支持 Docker 一键部署。(@star7th 投稿)

15、FindJSONPath

在线的 JSON 工具箱,可以生成 mock 的 JSON 数据,以及可视化选中某个路径。(@bingobray 投稿)

16、拼字幕

在线制作字幕拼图的工具,上传图片、填写文本即可。(@xiaoshangmin 投稿)

17、YouTube Playlist Processor

这个工具用 AI 将 Youtube 播放列表转成一本电子书,参考这篇介绍文章

资源

1、素材 SoSo

免版权的图片和视频素材搜索引擎,支持语义搜索。(@YeDaxia 投稿)

2、FeedMe

提供多个信息源最新内容的 AI 摘要,代码开源。(@Seanium 投稿)

3、吉卜力电影的高清图

吉卜力工作室的官网,放出了它们几乎所有电影的几百张高清图。

图片

1、盘式胶卷

1982年,柯达公司推出了盘式胶片相机。这种相机的胶片不是传统的一卷,而是一张张放在圆盘上。

上图的圆盘,外围的一圈就是一张张胶片。

这张设计的好处是,胶片相机可以做得很薄,塞在口袋里。

这种相机的卖点是廉价和便携,最便宜的型号只要68美元。但是,它的胶片比标准胶片小很多,导致画质不佳,而且一张圆盘只能拍15张照片,并且需要专用的冲印机。

这些不利因素导致这台相机只生产了6年,到1988年就不得不停产。

文摘

1、约翰·巴洛的人生格言

约翰·巴洛(John Perry Barlow,1947-2018)是一个美国的著名作家。

60岁生日的那一天,他告诉朋友,他的一生有25点信条,是一直遵守的。

其中有几条,表达了一个核心观念,就是时刻对自己、对他人保持怀疑,不要坚信不移。

(1)拓展你对可能性的感知。所有事情都是可能的。

(2)容忍模棱两可。有些事情是不确定的,说不清是好是坏,是对是错,要容忍这样的事情。

(3)经常自嘲。永远不要忘记,无论你多么确定,你都有可能犯错。

(4)要关心什么是对的,不要关心谁对谁错。

(5)一旦发现自己错了,不要放过,也不要不承认。

(6)懂得谦逊和原谅他人。

2、Web 开发的未来

这篇文章发布于25年前,现在的标题如下。

Web 开发的未来是 AI,要么加入,要么落后

历史上,我曾经多次修改标题。为了便于后人参考,我把它们依次列在下面。

Web 开发的未来是区块链,要么加入,要么落后

Web 开发的未来是 CSS-in-JS,要么加入,要么落后

Web 开发的未来是渐进式应用,要么加入,要么落后

Web 开发的未来是 Silverlight,要么加入,要么落后

Web 开发的未来是 XHTML,要么加入,要么落后

Web 开发的未来是 Flash,要么加入,要么落后

Web 开发的未来是 ActiveX,要么加入,要么落后

Web 开发的未来是 Java 小程序,要么加入,要么落后。

文章的正文一直不变。

如果你不使用这项技术,那你就是在搬起石头砸自己的脚。

它在未来一定会占据主导地位,发挥重要作用。如果你不使用它,你就会失业。它解决了我们遇到的所有开发问题。

购买我的5000元课程,我来教你,如何学会它。

言论

1、

上个月的流行词是"氛围编码"(vibe coding),本月的流行词就是 MCP 了。

-- 《我的 AI 笔记》

2、

两个想法之间的差距越大,它们的结合就越具有原创性和令人惊讶性。

-- 尤德·肯尼特(Yoed Kenett),美国心理学家

3、

心甘情愿地接受限制,可以增强而不是抑制创造力。

-- 《受约束的创造力》

4、

AI 研究的最终目的是,它编写我们不理解的程序,来解决我们不知道如何解决的问题。

-- 莱斯利·兰波特(Leslie Lamport),美国著名计算机科学家,排版系统 LaTex 的创始人

5、

人们在夜晚和周末所做的事情,代表了世界上所有未充分利用的时间和精力。

-- 安德鲁·陈《冷启动问题》

往年回顾

三十年,解决人生三大问题(#300)

新技术的最大风险(#250)

低期望,多尝试(#200)

当音乐还是稀缺的时候(#150)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月 9日

谷歌的 NotebookLM 能生成中文播客了

作者 阮一峰
2025年5月1日 12:26

两天前,谷歌发了一个公告

它旗下的 AI 笔记产品 NotebookLM,现在支持50种语言生成播客了(原来只支持英文)。

我一定要分享这个消息,终于能生成中文播客了。这是我一直想要的功能,相信也是很多朋友想要的。

我演示一下,大家听听效果,会惊到你的。

首先,访问它的官网,点开右上角的设置,选择"Output Language"(输出语言)。

切换到"中文(简体)"。

然后,在首页新建一个笔记本。一般来说,一个学习主题,对应一个笔记本。

作为演示,我新建了一个"中国小说"的笔记本。进入后,在 Source(原始材料)标签页上传了鲁迅的《阿Q正传》。

注意,上传的文件格式目前只限于 PDF、TXT 和 Markdown。

另外,经过我测试,如果是图片扫描的 PDF 文件,它会自动进行文字识别。

接着,切换到 Studio(工作室)标签页,点击 Generate(生成)按钮,它就开始生成播客。

几分钟以后,播客就生成了,里面是一男一女在谈论你上传的资料。

大家听听看,是不是很像那些精心准备的真人播客。

NotebookLM 不仅可以上传文本材料,还可以针对网站和 Youtube 视频,生成播客。

我随便找了一个 Youtube 的英文视频,内容是国产旗舰手机的摄影能力比较。

下面是生成的播客

我听了以后,觉得都不必看视频了。而且,中文播客比英文视频,更容易抓住重点。

总之,有了中文播客以后,任何枯燥的学习资料,都能变成平易近人的播客节目。走路、休息、锻炼、开车的时候都能听,学习时间和途径都变多了。

需要注意的是,免费账户一天只能生成三个播客,更多需要付费。

除了播客,NotebookLM 的 AI 笔记功能,也非常好用。

你可以上传自己的学习材料,也可以用它搜索某个主题的学习材料。

下面是我用它搜索 PostgreSQL 数据库的学习材料。

指定学习材料以后,你可以跟这些材料聊天。

它还会自动生成各种笔记:学习指导、内容摘要、常见问题、时间线等等。

以上就是 NotebookLM 的基本用法。

我的评价是,NotebookLM 是一款革命性的笔记工具,属于少数几个真正有重大用处的 AI 产品。

它会改变做笔记的方式和学习方式,每个学习者都应该知道有这样一个工具。

它属于谷歌的产品,似乎还没有竞品,希望国内的厂商能够做出替代品。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年5月 1日

科技爱好者周刊(第 346 期):未来就是永恒感的丧失

作者 阮一峰
2025年4月25日 08:09

这里记录每周值得分享的科技内容,周五发布。([通知] 下周五一假期,周刊休息。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。

封面图

大阪世博会的中国馆,以"中华书简"为主题。(via

未来就是永恒感的丧失

有一类人叫做未来学家(Futurists),专门研究未来。

这类人通常很快被忘记,因为他们的预测基本不准。就算偶尔说对了,后人也会觉得稀松平常。

历史上最著名的未来学家,大概是一个叫做阿尔文·托夫勒(Alvin Toffler,1928--2016)的美国人。

上个世纪七十和八十年代,他写过很多预测未来的书,非常畅销。1983年,国内就引进了他的书,轰动一时。

时过境迁,现在几乎没人提他了。

前些日子,一个朋友对我说,你可以去看看他的书,居然没有完全过时。

我看了一些片段,很震惊。这些片段根本不像写于半个世纪之前,更像写于现在。

托夫勒的第一本书,叫做《未来的冲击》,写于1970年,国内有中文版。

下面就是他的主要观点。大家一定要记住,这些话写于1970年,那个时候还没有信息革命,既没有个人电脑,也没有手机和互联网。

托夫勒认为,人类以前是农业社会,现在是工业社会,即将进入超工业社会

超工业社会有两个特征。

首先,工业人口只占少部分,大部分人从事脑力劳动。

其次,即使少部分人从业工业,生产出来的工业品,也大大超过需要。

那么,问题就来了。如果50%、甚至40%的工业生产能力,就能生产出满足所有人需要的工业品,那么会怎样?

托夫勒说,为了消化掉多余的工业品,结果就是加速。社会开始让消费加速,让技术也加速,最终让商品的流通速度变快,只有这样才能消费更多的商品。

这意味着,人类社会将变快。我们生活的根本特征,不再是持久,而是短暂

(1)生活用品变得短暂,越来越多一次性产品:一次性筷子,一次性圆珠笔,一次性塑料瓶,甚至一次性衣服。

(2)即使长期使用的产品,也在快速升级换代。微波炉、洗衣机这样的耐用消费品,人们也只要今年的型号,不要去年的型号。

(3)社会充斥着速成食品、速成教育,甚至城镇也可以速成。

(4)知识短暂化,用过即弃。

(5)工作变得短暂。职位、公司、甚至行业,随时都会消失,新的部门和行业不断涌现。

(6)生活环境变得短暂。人们经常搬家,不会在一个地方久居。

(7)人际关系变得肤浅。人与人之间很难产生稳定深入的关系,交流持续的时间缩短,更多的是偶遇和点头之交。

(8)人们面对快速变化,内心感到疲惫和衰弱,情绪变得不稳定,精神病人变多。

总之,未来的根本特征,就是永恒感的丧失,取而代之的是短暂感。

Trae 的 万「友」引力计划

本周,字节的 AI 编辑器 Trae 发了新版,可以调用 MCP 服务器了。

这可是重磅消息,开辟了一个全新天地,我还写了一篇教程

官方为了推广,投入了大量资源,Doubao、DeepSeek、Claude、Gemini、GPT-4o,现在都是免费用(后三个模型需要 Trae 海外版)。

为了让更多的同学参与,只要你深度体验 Trae,完成简单任务,就可以获得相应积分,兑换奖品。

奖品包括 华为 MatePad Air、雷蛇机械键盘、热门 App 会员卡等。

详情访问这个链接,或者扫描上方海报的二维码。

机会难得,既能学习 AI 和 MCP,还能拿奖品,大家不要错过哦。

科技动态

1、虚拟味觉

香港城市大学的科学家,提出了一种虚拟味觉的实现方法。

他们做了一个类似棒棒糖的"虚拟味觉器",用户把它含在嘴里。

它会以"离子泳"的形式,释放水凝胶。目前,一共9种口味的水凝胶,也就是说用户可以尝到9种味道:糖、盐、柠檬酸、樱桃、百香果、绿茶、牛奶、榴莲和葡萄柚。

这里的关键是,水凝胶的释放可以编程控制,因此可以用来在电子游戏中增强用户体验,或者网上购物时让用户先品尝食品味道。

2、旅行推销员问题是一个著名的计算机科学问题。

它的表述是,怎么规划出一条最短路线,可以拜访每一座城市一次,最终回到起始城市。

最近,一个国际团队打破了旅行推销员问题的世界纪录

他们规划出一条最短路线,可以一次性走遍韩国所有81,998家酒吧。

一刻不停的步行,完成这条路线一共需要178天。

此前的世界纪录是2021年创造的,走完荷兰57,912个纪念碑的最短路线。

3、Vision Pro 的新用途

苹果的 AR 头盔 Vision Pro,售价高达3万元人民币,销量并不好。

用户普遍觉得,它的用处并不大,售价又这么贵。但是,它意外在一个场合非常受欢迎。

美国的一些医院发现,它可以用于微创手术。医生戴着头盔,给病人开刀,上图就是两个这样的医生。

很多手术,尤其是涉及血管和神经的手术,要求非常精细,动刀位置不能有一点差错。

医生不可能凑上去看,现在都是用摄像头放大后,看着显示器动刀。

Vision Pro 戴在眼前,影像更大,看得更清楚,而且还能叠加多窗口,显示心率血压等指标。

医生非常喜欢这个设备。价格完全不是问题,因为手术用显示器的价格是 Vision Pro 的好几倍。

4、其他

(1)北京举行机器人半程马拉松比赛。21公里的路程,冠军成绩是2小时40分42秒,需要更换三次电池。

(2)4月25日的日出前,土星、金星、月亮,将组成笑脸图案

(3)亚马逊在欧洲实验,让送货卡车配备心脏除颤器,一旦送货时遇到突发心脏病的人,可以进行急救。

(4)索尼推出全球最小的激光雷达,适合用于无人机、机器人。

文章

1、昊龙:中国首个货运航天飞机(中文)

天宫空间站的补给,目前由天舟飞船完成。但是,天舟每次返回大气层,都会烧毁。

国内正在研究可以重复使用的"昊龙"货运飞船,以降低货运成本。

昊龙已经完成了设计,正在工程测试阶段。

2、如何使用 UTM 在 Mac 电脑架设虚拟机(英文)

一篇教程,教你如何在 MacBook 安装 utm 虚拟机,从而方便地使用 Linux 系统。

3、清理<head>(英文)

网页的<head>部分里面,很多标签是不必要的,这个网站介绍可以删除的标签,比如 favicon、Apple touch icons。

4、线上故障应急处理:4 年多 on call 经验总结(中文)

我的第一份工作是 CDN 基础设施研发,考虑到公司体量,那些年其实故障蛮多的。在故障处理中,积累了一些经验教训,总结回顾一下。(@swananan 投稿)

5、在 Docker 沙箱中运行 MCP Server(中文)

本地运行他人的 MCP 服务器有极大的风险,本文介绍怎么在 Docker 沙箱里面运行。(@ccbikai 投稿)

6、如何用 Whisper 生成字幕(英文)

本文是作者的操作记录,演示如何用 OpenAI 公司的 Whisper 模型为视频文件生成字幕。

工具

1、Open Props UI

一个 CSS 组件库,使用最新的 CSS 规范,也就是说,不考虑兼容老旧浏览器。

2、ts-blank-space

一个从 TypeScript 脚本剥离类型代码的工具,也就是将 TS 脚本转成 JS 脚本,但是不进行类型检查。

3、Better Auth

一个 TypeScript 的用户身份认证库,功能全面,密码登录、双因素认证、外部身份提供商等都支持。

4、Browspilot

Chrome 浏览器插件,自动保存所有浏览过的网页,提供浏览历史的全文搜索。

5、to-unocss

这个网页工具将 CSS 代码转成 unoCSS 或者 TailwindCSS 的写法。(@Simon-He95 投稿)

6、NoteGen

跨平台的 Markdown 笔记软件,支持接入 AI 模型。(@codexu 投稿)

7、speed-github

一个修改 hosts 文件,加快 GitHub 访问速度的 Python 脚本。(@jvxiao 投稿)

这里还有一个 Cursor 的 hosts 文件生成器。(@Oliverwqcwrw 投稿)

8、旅游翻译器

网友做的旅行翻译网站,支持对话翻译和拍照翻译,代码开源。(@traveltranslator1 投稿)

9、Shui

开源的桌面软件,定时提醒喝水。(@rock-zhang 投稿)

10、SnowAdmin

基于 Vue + Vite 的网站管理后台模版。(@WANG-Fan0912 投稿)

AI 相关

1、chatlog

用 AI 处理微信本地聊天记录的工具。(@sjzar 投稿)

2、HowToCook-MCP Server

一个 MCP 服务器,提供中文菜谱、餐食规划。(@worryzyy 投稿)

3、Midscene.js

字节推出的 JS 工具,最新功能是通过 AI 和 adb,完成安卓手机自动化。它早先已经可以浏览器自动化。(@yuyutaotao 投稿)

4、MCP Gateway

一个 Go 语言写的网关服务,将已有的 API 转成 MCP 服务,无需改动任何代码。(@iFurySt 投稿)

资源

1、全球地铁线路图

这个网站收集了全球各大城市的地铁地图。(@027xiguapi 投稿)

2、如是我闻

佛经阅读平台,带有 AI 翻译和问答。(@bolechen 投稿)

3、They see your photos

该网站对用户上传的照片给出详尽描述,从而可以发现照片泄漏了多少信息。

日本木匠大会

日本每年举行一次全国木匠大会

大会有一个项目,就是刨花比赛,看看谁的刨花最薄。

比赛规定,木材必须是宽55毫米、长1800毫米的桧木。进入决赛的5名选手,为了公平,将使用同一块桧木。

刨出来的刨花必须完整,没有裂口,长度在1米左右,才能参加评分。

工作人员把所有选手的刨花,挂在黑板上,进行公示,评委进行打分。

这些的刨花如此之薄,令人不敢相信。

冠军选手的成绩是50微米,也就是1毫米的20分之一。

文摘

1、你是创造者还是消费者?

我是一个信息瘾君子,对各种信息上瘾。

当我想学习一项新技能,或者有了一种新爱好,我就立即前往亚马逊网上书店,购买3~4本该主题的书籍。

现在我的书柜里面、有关于 HTML 基础知识、纸牌魔术、高尔夫、编剧、赛车、冥想、举重以及大约10个其他主题的书籍。

我也会订阅一些博客和播客,阅读所有最受欢迎的帖子,聆听了各种专家访谈。有时候,我甚至会在 Evernote 做一些笔记,或者在浏览器为某些页面添加书签。

然而,我总是缺少一件事:实际成果。

我对那么多东西感兴趣,也学了很多,但是没有做出什么成果。

我只是查找和使用信息,这很容易,对于像我这样好奇的人来说,这通常也非常有趣。

但它实际上并没有完成任何事情,这是伪工作,一种自我安慰。

创造才是更有效的方式,你开始制作东西----网站、成功的高尔夫击球、剧本等等,不管是什么----然后,无非就是两种结果。一种结果是你意识到自己对它不那么感兴趣,另一种结果是你真的喜欢它,开始深入研究。无论哪一种结果,都是值得的,而盲目消费信息,则是一种无效的表面行为。

言论

1、

AI 伴侣可以减少孤独感,但是会产生新的问题。它可能取代人际互动,让你丧失基本社交技能,从而变得更加孤立。

-- 哈佛商学院的一项研究

2、

简单和优雅不受欢迎,因为它们需要努力工作和纪律才能实现。

-- Edsger Dijkstra,著名计算机科学家

3、

规则就像汽车上的安全带:一开始可能会有点不舒服,但一段时间后,使用规则就会成为习惯,不使用规则就变得不可想象。

---- Gerard J. Holzmann

4、

企业编程必须始终依赖流程,而不是个人。

个人能力很重要,应该鼓励,但不能指望它,否则软件质量将不一致,没有可持续性。一旦顶级程序员跳槽,公司就会陷入困境。

企业应该努力改进工作流程,而不是努力改进人员,始终坚持流程优先于人员。

-- 《创作系统,而不是创造英雄》

5、

我喜欢软件,因为软件可以创造无限可能性和一种非凡的民主。

-- Hacker News 读者

往年回顾

AI 的关键是语料(#299)

最成功的软件企业家(#249)

俄罗斯的 HTTPS 证书问题(#199)

新能源汽车,谁会是赢家?(#149)

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月25日

巨头的新战场:AI 编程 IDE(暨 字节 Trae 调用 MCP 教程)

作者 阮一峰
2025年4月22日 15:08

一、引言

本周,我要加写一篇文章。

因为 AI 编程 IDE 突然成了热门,国内外都有大事发生。

先说国外,OpenAI 要用30亿美元收购 Windsurf

这个消息太惊人。Windsurf(前身叫做 Codeium)的历史很短,发布至今两年多,市场份额也不高,居然值这么多钱!

OpenAI 最新一轮融资(今年3月)不过400亿美元,现在一下子要拿出30亿去收购,看中 Windsurf 哪一点呀!

OpenAI 自己没有编程助手,所以唯一的解释是,它要收购 IDE 打入 AI 编程市场,这个市场对它很重要。

二、MarsCode 更名 Trae

再看国内,字节也有大动作。

它旗下的编程助手,最早是 MarsCode 插件,后来又多了一个独立的 AI IDE 产品 Trae

本周,MarsCode 宣布改名为 Trae 插件,不再作为独立品牌发展了。

以后,字节的 AI 编程助手,将只有 Trae 这一个品牌,分成两种产品形态。

习惯传统 IDE 的用户,可以加装 Trae 插件;想要更好 AI 体验的用户,可以安装独立的 Trae IDE。

这个消息公布的同时,Trae 新版本也一起发布,加入了重磅的新功能(后面会详谈)。

可以看出,字节是下了决心,整合了产品,准备在 AI 编程工具上发力了。

三、AI IDE + MCP

为什么国内外的巨头,在同一个时间,不约而同都看上了 AI IDE?

我猜想,答案是 MCP 的出现。

有了 MCP 以后,AI IDE 可以扩展外部能力,从而无所不能,这让它成为巨头的必争之地。

下面,我来解释 MCP 是什么,怎么在 Trae 里面调用。大家看了,就会理解为什么 MCP 这么重要。

四、Trae 的简介

我选择 Trae 来演示,主要因为它是国产软件,有中文界面和文档,并且完全免费(国外产品都需要付费)。

前面说过,Trae 分成插件和 IDE 两种形态,它的 IDE 又分成国内版和海外版。这些产品的功能基本一致,就是内置的 AI 模型不一样。

国内版:内置 deepseek R1、V3、v3-0324 和 doubao 1.5 pro 模型

海外版:内置 Claude 3.5、3.7,Gemini 2.5 pro,GPT-4o、GPT-4.1 模型

我建议使用国内版,因为海外版的内置模型经常需要排队,很浪费时间,而且可能还会通信不畅。

不过,这两个版本都支持自定义模型,你可以提供密钥,接入你指定的模型。所以,版本的差别也不算很重要。

顺便提一下,Trae 这个词的意思是"The Real AI Engineer"(真正的 AI 工程师)。我以前总是以为 Trae 的意思是 True Ai。

五、Trae 的新版本

Trae 的 MCP 调用功能,是从新版本 v0.5.0 开始加入的。

没安装的朋友,可以去官网下载新版。已经安装的朋友,请检查一下版本。

它的界面这一次简化了,聊天框和 Builder(项目生成)合并成一个对话框(下图)。所有跟 AI 的对话,都在这里输入。

上图中,左下角多了两个按钮:"@智能体"和"#上下文"。这就是本次新增的核心功能。

至于 Trae 的基本用法,这里就不提了,可以看以前的文章

六、调用智能体

MCP 调用的入口,就是上图左下角的"@智能体"按钮。

如果想要扩展 AI 的功能,就要使用这个按钮。因为 AI 模型的本质只是语言模型,自身的功能是有限的,必须通过外部应用(智能体)来扩展功能。

点击"@智能体"(或者输入@),就会弹出一个对话框,显示目前可用的智能体(下图)。

可以看到,Trae 内置了两个智能体:"@Build" 和 "@Builder with MCP"。

其中,"@Build"用来让 AI 生成一个可运行的新项目。

@Build 俄罗斯方块网页小游戏

输入上面的命令,就会生成一个 HTML 文件,打开就是俄罗斯方块小游戏。

另一个内置的智能体"@Build with MCP",就是用来连接 MCP 服务器。

七、MCP 是什么

我先解释一下,MCP 是什么,很容易理解。

我们知道,AI 模型通过连接外部应用,来扩展功能。每个外部应用的接口,都不一样,如果要接入10个应用,就要写10种接入代码,非常麻烦。而且,要是换一个模型,可能所有接入代码都要重写。

有鉴于此,Anthropic 公司在2024年11月提出了 MCP 协议。外部应用只需要支持这个协议,提供一个 MCP 接口(又称 MCP 服务器),那么 AI 模型就可以用统一的格式接入,不需要了解外部应用的接入细节。

所以,MCP 可以理解成一个 AI 与外部应用之间的适配层。对于 AI 来说,只要安装某个应用的 MCP 服务器,就能接入该应用,不用写任何代码(除了少数的配置项)。

由于 MCP 解决了 AI 应用的接入痛点,诞生至今仅半年,已经变得极其流行,就连 Anthropic 的竞争对手 OpenAI 公司都公开支持,网上开源的 MCP 服务器项目已经有上万个。

八、调用 MCP

现在就来看 Trae 怎么调用 MCP。

点击 AI 标签栏右上角的齿轮图标,弹出一个菜单,选择菜单项 MCP。

它会跳出一个 MCP 的标签页(下图),点击底部的"+ 添加 MCP Servers"。

Trae 内置了 MCP 市场,提供一些常用的 MCP 服务器。如果里面没有你需要的,可以点击"手动配置",添加你自己的 MCP。

为了便于演示,我选择第一个服务器 Puppeteer,让 AI 可以调用无头浏览器。

鼠标点击 Puppeteer 的名字,会进入该开源项目的主页,可以查看一下它提供的内部命令(即能力)。

上图中可以看到,这个 MCP 服务器提供 puppeteernavigator(打开指定网址)、puppeteerscreenshot(截图)、puppeteer_select(选中页面元素)等内部命令,供 AI 模型调用。

用户不需要记住这些命令,只需了解它有哪些能力就可以了。

接着,点击它后面的加号,添加该 MCP 服务器。

这个 MCP 带有"轻松配置"标签,表示不需要任何设置,可以直接运行。

所有自己添加的 MCP,默认都放在内置的智能体"@Build with MCP",所以可以通过这个智能体来使用。

在 AI 对话框里面,选中智能体"@Build with MCP",然后输入下面的命令"打开 https://www.baidu.com",试试看新安装的 Puppeteer 服务器。

正常情况下,Trae 会让你选择一个项目文件夹,然后就会打开一个浏览器窗口,显示百度的首页。

这就是 MCP 的作用。AI 本来没有能力控制浏览器,但是现在就可以通过 MCP 来控制。

接着,可以给出一些更复杂的命令,比如生成截图,也能顺利完成。

这就是调用 MCP 的基本流程。你还可以把添加的 MCP 服务器保存成智能体(下图)。

然后,通过你起的名字,调用该智能体(下图),从而连接指定的 MCP 服务器。

九、上下文功能

除了 MCP 调用,Trae 的本次更新,还加强了上下文功能,这里也简单提一下。

所谓上下文,就是额外提供的信息,帮助 AI 模型思考,来完成任务。

通过#号,可以调出上下文菜单。

从上图可以看到,可以提供的上下文,包括额外的代码(code)、文件(file)、目录(folder)、工作区(workspace)。

本次更新多了两个选项,"Doc"表示额外的文档。

点击"添加文档集",就可以添加文档目录,作为 AI 模型的上下文。

另一个选项"Web",表示用网上信息作为上下文。这为 AI 提供了实时联网能力。

上图的实时天气问题,AI 只有具有联网能力,才能回答。

十、总结

有了 MCP 调用和联网能力,AI IDE 就具备了巨大的想象空间,不仅仅是编程工具,而成了一个无所不能的 AI 控制台。

那些大公司一定是看到了这一点,所以才愿意投入大量资源,去做这个产品。

我认为,在 AI IDE 里面调用 MCP 服务器,将成为近期软件业的热点,值得大家重点关注。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月22日

办公类 AI 初探:扣子空间

作者 阮一峰
2025年4月21日 10:50

一、AI 的风口

问问大家,AI 产品的风口是什么?

我的意思是,什么样的产品有最大的机会。

现在的 AI 多如过江之鲫,大部分都是昙花一现,走不远。

在我看来,最有机会的产品,既不是面向普通大众的问答类 AI,或者内容生成 AI,也不是面向开发者(API 用户)的编程 AI。

真正的风口是办公类 AI

企业和个人的办公市场巨大无比,而且有真金白银。

谁能把 AI 引入文档、会议、决策......,谁就会吃到肉。就像 Office 软件是商业软件之王一样,企业级办公 AI 也一定会是 AI 的销售之王。

二、办公类 AI 的现状

不过,办公类 AI 眼下寥寥无几。不要说赢得市场,就连想得起名字的产品都不多。

究其原因,一是 AI 现阶段的能力,还达不到企业级软件的安全、稳定、准确、高效。

二是办公类 AI 到底是什么样的产品形态,大家还在摸索。

我一直非常关注这个领域,对于新出现的办公类 AI 有着强烈的兴趣。

下面介绍一个新产品"扣子空间",我这些天一直在试用。大家看看,它怎么用 AI 完成办公任务。

三、扣子空间

先说一下,扣子(coze.cn)是一个国内的平台,提供基于浏览器的低代码环境,来搭建 AI 应用,有免费额度。

我一直是它的用户,以前还写过文章,介绍它的工作流模式:在图形化界面上,用鼠标编排 AI 工作流,生成独立应用。

工作流模式号称不需要编码,小白也能用,但用户最好有编程基础,所以还是有一点点门槛。

于是,扣子现在又推出了"扣子空间",真正零基础,无门槛完成任务。

它的最大特点是,内部自动调用各种 Agent(智能体),不需要用户介入,就能完成各种任务。你可以把它想象成一个"Agent 的自动调用器"。

对于用户来说,因为有了底层的 Agent 能力,它不仅可以回答问题,还能解决问题(任务),从而成为你的办公助手和工作搭子。

正如它的宣传语:"和 Agent 一起开始你的工作"。

注意,它现在需要邀请码,可以去扣子公众号和扣子空间官网(space.coze.cn)领取。

四、界面

扣子空间的网址是 space.coze.cn,点进去就可以使用。

界面很简单,左侧是任务列表,右侧是一个对话框,用来输入新任务。

执行任务要求时,默认是"探索模式",AI 自动完成各个步骤,速度较快。

你也可以改成"规划模式",显示 AI 思考的中间步骤,便于随时调整。

除此以外,就没有需要设置的地方了,很符合直觉。

五、任务示例

下面是我的一些使用实例,都是办公类的任务。

大家看看,它完成得怎么样,像不像一个精通各种技能的实习生。

5.1 撰写研究报告

最常见的办公任务,肯定是撰写文档。我让 AI 撰写下面的研究报告。

我需要一篇研究报告,关于上海茶饮行业近几年的发展情况,以及投资机会的分析,包括行业发展、热门产品等信息。

注意,文档类的任务最好指定输出格式,否则生成的内容以 Markdown 格式展示在对话页上,不方便利用。

我一般是在提示词最后,加上这样一句。

同时做一个可视化的网页。

开始运行后,它就会分解任务,按步完成。

最后,它给出生成的 markdown 文件和网页文件。

你可以在新窗口打开网页预览。下面就是它生成的网页,图文并茂,有数据也有论述。

整个报告分成四个部分,可以根据需要增减,自己使用或交差,总体上没有问题。

5.2 多种输出格式

前面说过,扣子空间内置了各种 Agent。

除了生成网页的 Agent,还有生成 Office 文档、PDF、飞书文档的 Agent,都可以用,下面是一个例子。

帮我比较一下T3、滴滴出行、高德,作为新手网约车司机,在重庆跑,哪个平台最推荐,并说明详细原因,输出一份飞书文档。

由于飞书文档是带有布局的,实际生成时,也是从文字报告生成网页,然后系统提示你将网页内容复制到飞书。

如果输出 PDF 文件或幻灯片 PPT 文件,系统会直接给出文件下载。

我正在编排行程,目的是安徽皖南地区,包括黄山和当地的其他风景点,请详细研究行程、交通路线、景点介绍、门票、住宿和当地饮食等信息,形成一份完整的行程安排,以 PPT 形式展示。

它生成了一个28页的 PPT 文件,下载后,完全可以直接上台演示。

5.3 表格能力

办公类的 AI,一定要有表格处理能力。

请生成一个表格,包含上证50指数成分股,及其最新的收盘价。

默认情况下,表格生成后,会显示在网页上。

系统还会给出一个 csv 文件,供下载。

如果想要完备的电子表格功能,可以把 csv 文件导入电子表格软件。

5.4 其他功能

扣子空间内置的 Agent 很多,还可以调用高德地图、生成网页游戏等等。

请生成一个互动式的学习网站,帮我学习 CSS 的 oklch 颜色函数。

上面是网页小游戏的例子,下面是调用地图的例子。

用高德地图分析一下上海外滩地区所有瑞幸咖啡的门店选址,做成一个可视化的网页给我。

如果内置的 Agent 不足以满足需求,你还可以设置让它接入各种 MCP,扩展能力。

5.5 专家系统

最后,它还自带了专家系统,也就是高级的专业知识库,提供深度的分析能力。

目前,内置了两个专家系统:用户研究专家和 A 股观察助手。

前者用来用户问卷调查、访谈、生成分析报告;后者用来分析自选股和大盘,提供研究分析报告。

深度的分析和处理任务,需要特定的专业知识,可以试试它们。

六、总结

经过初步的试用,我对扣子空间评价很好,非常好用的办公助手和 AI 实习生,确实能够提高办公效率。

我觉得,它的设计思路很正确,自动调用各种 Agent,既能扩展各种能力,又能消除了上手难度,同时具备深度研究(deep research)能力。

更难得的是,它的完成度相当不错,没遇到明显的 bug,可以用于实际的办公。

总之,作为办公类的 AI 产品,它的"工作搭子"的模式,我觉得可用也可行。

后面,办公类 AI 产品相信会大量涌现,鉴于它的重要性,我还会介绍和评测更多。

(完)

文档信息

  • 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证
  • 发表日期: 2025年4月21日
❌
❌