阅读视图

为什么说 LCD 永不为奴？

2023年8月31日 20:30

几年前的机圈实在是太有意思了，记得之前在某数码论坛里，天天看到有人嚷嚷“LCD 教”永不为奴。

这些极端用户，会苦口婆心地和你讲为啥OLED不好，还记得某知名博主就使用大量篇幅科普了OLED为啥不好，比如低健康风险的频闪范围应该在 1250Hz 以上，而 OLED 屏幕频闪却只有 240Hz；相同频率下对人体的健康影响比 LED 灯更严重除此之外LCD也不存在烧屏问题。

但近几年网络上关于OLED和LCD的争执已经越来越少，一方面原因是目前市面上绝大多数手机都采用了OLED屏幕，LCD屏幕已经很难看到；另一方面，OLED经过技术发展几乎不会再有烧屏现象，加上素质更高，因此替代了LCD屏幕。

但这不意味着LCD就从手机市场中彻底消失了。

为啥我认为入门机用LCD屏是正确的

我这里简单说说LCD和OLED区别。

从发光机制来讲，LCD是需要背光才能让屏幕亮起来，功耗较高。而OLED每个像素都有小光源，可以单独控制发光，功耗低一些，但LCD因为结构简单，反而要比OLED屏幕更加坚固，而且也不会出现烧屏问题，当然还有另外一个重要原因，要比OLED护眼。

左：iQOO Z8 中：iPhone 右某国产安卓旗舰一目了然而且屏幕色彩还很准图源：品玩：ByArsT摄

手里这款iQOO Z8一大亮点，就是采用了一块显示效果不错的LCD屏幕。抛开成本不说，这块屏幕确实非常适合“入门机”定位的。

首先需要明白一个道理，购买入门机的无外乎是给家里孩子老人买，LCD屏幕对于学生和退休在家一刷抖音就是半天的中老年用户来讲，确实能起到一定保护作用。

各取所需

最近机圈的火热程度自然不用多说，各家都要在2k-3k元档位争个你死我活，配置更是卷上加卷，但其实看下来无非是屏幕更好一些，镜头规格更高一些，你把塑料做出金属质感，我把机身做得更漂亮一些。

似乎从各家之后的战报上来看，九位数的数字都在告诉大家，我家最牛。

但对于消费者来讲，他们更加关注线下店买到底能有什么直减优惠，能不能分期，是否有购机小礼品等等，但我光顾实体店后发现，商家口中的“入门机”起售价已经超过2K元，而且对配置闭口不谈，似乎消费者知道配置后就不买了。

要我是店长，我一定把iQOO Z8摆放在最显眼位置。原因在于，首先它有拿的出手的外观，虽然这次没有拿到把树脂做成陶瓷质感的月瓷白配色，但手里这台带有渐变蓝的星野青，估计能吸引不少学生，低调内敛。

其次是性能不差，天玑8200这枚处理器搭载在中端机上完全能说得出口，毕竟很多高价机型都采用同款处理器。最后，少见的搭载了120W快充，以及光学防抖主摄，对于喜欢旅行的阿姨叔叔，充电快拍照清楚，完全够用。

作为vivo的子品牌，iQOO这个品牌的定位就是极致性价比，本应该是完全主打线上渠道的营销策略，但得益于vivo的重视和全力扶持，我们在线下门店浏览时，经常看到vivo和iQOO共用渠道的现象。

而且根据我个人观察，iQOO在线下出现的频率和在门店展示位置的比重越来越高，这代表了市场对于其品牌的认可程度逐渐提高。得益于这一点，iQOO用户在售后及维修方面，也变得更为方便。相信对于绝大多数中老年人来说，在手机万一出现各种问题需要售后时，去离家不远的门店就能享受一站式服务，当天修好带走，总会比寄快递返厂更让人安心一点。

根据IDC的统计数据，2022年，vivo的市场份额为18.6%，位于市场前列，而其独立品牌iQOO自2019年问世至今，受到了市场上越来越多的认可和选择。最近，全新入门级性价比机型iQOO Z8正式发布，配备了一块目前新机不可多得的LCD屏幕，建议预算不多或对LCD有“刚需”的朋友可以多关注一下这款新品。

最后聊聊iQOO Z8优缺点：

优点：

1、LCD屏色彩准确，硬度高

2、主摄带OIS光学防抖，千元价位少见

3、标配120W充电器

缺点：

1、屏幕底部在低亮度下仍有背光不均现象

2、缺少超广角镜头

谷歌新模型的算力已是GPT-4的5倍，要大力出奇迹反超OpenAI了？

品玩

李欣帅

2023年8月29日 20:49

谷歌正凭借强大的算力储备和基础设施快速研发下一代AI大模型。AI“一哥”的位置被OpenAI暂时取代之后，该位置或许即将重回谷歌手中。据SemiAnalysis报道，谷歌下一代大模型Gemini的训练算力已达GPT-4的5倍。

众所周知，算力是AI大模型研发的“超级引擎”，它能让模型更快地学习、分析数据。算力不仅影响着模型的研发进度，还直接关系到模型的性能和可靠性。

因此，在AI热潮席卷全球的当下，引发了一场前所未有的“算力争夺战”。从大型企业到创业公司，都在争抢提供算力资源的GPU，最终导致GPU供不应求。

就连OpenAI这样早早就手握大量GPU资源的公司如今都面临GPU短缺问题。在今年6月，OpenAI的CEO Sam Altman曾提到，OpenAI 现在最大问题来源于GPU。由于GPU短缺，客户对OpenAI提供的API的可靠性和速度有所抱怨。而更长上下文等功能的开放也受限于GPU。而为解决GPU短缺等问题，OpenAI目前正积极谋求融资。

与此同时，在OpenAI等公司为GPU犯愁时，谷歌有着自家设计的TPU（张量处理单元）。TPU是谷歌开发的人工智能加速器专用集成电路，于2015年开始在谷歌内部使用。自发布以来，谷歌已经构建了6种不同的AI芯片（TPU、TPUv2、TPUv3、TPUv4i、TPUv4和TPUv5）。

TPU是专门为机器学习设计的芯片，在AI研发的某些方面可能比GPU更高效。并可以高度优化以适应谷歌的软硬件生态和人工智能计算工作负载。尽管TPUv5单个芯片的性能与H100 GPU芯片还有差距，但在谷歌自家的生态系统（如TensorFlow框架）中，TPU通常会有更好的性能和成本效益。

据了解，谷歌全新架构的多模态大模型Gemini，正在以令人难以置信的速度迭代。最近的一次迭代算力高达1e26 FLOPS，是GPT-4训练算力的5倍。据SemiAnalysis预测，这一数字有可能在明年年底变为20倍。

谷歌的算力资源仍在快速增长。据报道，OpenAI即使在两年内将GPU总数增加4倍，谷歌的算力资源仍然处于大幅领先地位。目前OpenAI、Meta、CoreWeave、甲骨文和亚马逊的GPU总和仍要小于谷歌拥有的TPUv5数量。

由于算力的重要性，算力资源的差距很可能会成为谷歌拉近并拉开和OpenAI距离的关键因素。毕竟，拥有更多的算力资源意味着能进行更多的实验，更快地迭代模型。

除了在算力方面的优势，谷歌还拥有全球范围内的大规模数据中心，为大模型的训练和部署提供了强大的基础设施。这使得它与其他公司（如OpenAI）竞争时具有明显的优势。这种优势不仅体现在现有的资源上，还体现在其持续增长和未来发展的潜力上。

总体来说，谷歌在资源、技术、生态系统、商业模式和全球战略等多个方面可能具有优势，这使其在大模型的研发和发展方面具有相当的竞争力。至少在训练前的计算规模扩展和研发速度方面，谷歌应该会最终胜出。

相比之下，OpenAI虽然在模型设计和算法研究方面有着前沿的成果，但在硬件资源方面相对较弱。这种差距可能会限制OpenAI在模型规模和应用场景上的拓展能力。

充足的算力资源和高效的基础设施，会成为谷歌在AI研究和商业应用方面的利器，也可能会成为谷歌和OpenAI竞争的重要分水岭。当然，最后还是要看成品如何，也就是谷歌的下一代模型Gemini是否会比GPT-4 更有优势，这一结果可能在未来几个月会见分晓，Gemini据称会在今年秋季发布。它是否会取代ChatGPT的地位值得期待。

-End-

在获得算力之后

品玩

薛良Neil

2023年8月29日 17:40

只有算力是不够的

AI 服务器是大模型战争中兵家必争之地，因为它代表了最为紧俏和稀缺的算力资源。浪潮信息则正是中国大陆最大的服务器提供商。

每两台AI服务器就有一台出自浪潮信息——将AI算力芯片经过系统化的整机设计，最终变成包括计算单元、存储单元、散热单元和供电系统等在内的完整产品交付给客户。

在大模型出现之前，算力资源可以直接用服务器的数量来表示，需要多少算力，就购买多少台服务器就可以了，彼此的换算关系几乎是透明的。正因如此，浪潮信息所做的事情一度被认为非常简单——卖尽可能多的服务器就好。

但大模型的出现改变了这一切。

尽管每个人都在谈论算力和它的紧缺，但许多人不知道的是，即便有了充分的 GPU 芯片供应，训练大模型依然是一个非常复杂和艰困的过程。

比如仅仅是把几千张卡串联起来就是一个工程学上的大问题，国内有现成经验的只有几家最大的云厂商。再比如，相比传统的分布式训练，大模型训练过程更复杂，周期也更长，这就要求服务器集群在充分运用算力资源、提升性能的同时保证整个系统的稳定性，在这个领域几乎全行业都处于摸索阶段。

一个现实的数字是，未经工程优化的情况下，许多企业的服务器效率甚至只有 20%-30%，考虑到大模型算力的高昂成本，这种浪费无疑十分惊人。

但这一关又是不得不过的。

百模大战中，许多大模型是通过 API 调用或者云的方式训练出来的，为了追求速度这本无可厚非，但要想让大模型变得真正落地、可用，则必须进行算力的本地化部署，因为商业化能力的构建是离不开本地算力资源作为后盾的。

这很像是十年前公有云计算发展的脉络，在起步阶段第一波应用过后，公有云的普适化能力开始逐步落地到场景和行业中，于是本地化就随之开始了。

然而本地化又谈何容易呢？除了上面提到的服务器部署这种直接相关的痛点外，大模型训练实际上是一个冰冷的系统性工程问题，从数据清洗到算力适配，从性能兼容适配到软硬件协同，这些实践中的一个个坑所带来的挑战丝毫不逊于算力本身，它们共同影响着大模型的性能与落地的速度。

“客户最关心的就是本地化部署应用。”一位接近浪潮信息客户侧服务的人士向品玩表示。根据公开数据的粗略统计，参与百模大战的企业中有高达 80%都是浪潮信息的客户，因而企业本地化部署的问题，几乎也成了浪潮信息的问题。

仅仅是单纯卖硬件算力已经不够了，人工智能行业的极速变化要求浪潮信息也随之变化。

OGAI：针对大模型的五层解法

在 2021 年，也就是GPT 爆发之前，浪潮信息就推出了名为“源”的大模型，这个有 2457 亿参数的中文大模型，从数据搜集到千卡集群算力支撑的模型训练和推理都是浪潮信息自己完成的，也就是说，早在大模型成为一个现象级词汇之前，浪潮信息已经有了切实的第一手关于大模型开发、训练和微调的经验。

这让浪潮信息收获颇丰，比如在数据侧，从公开数据爬取、清洗到格式转化和质量评估，浪潮信息最终拥有了一个高达 5TB 的原创中文数据集，而在最重要的计算效率方面，浪潮信息已经可以达至50%左右。

从某种意义上说，这种行业 know how 经验甚至是奢侈的，只有浪潮信息这种算力供应商才能负担得起——要知道“源”模型的参数量比 GPT3 还多了 700 亿。

这些经验最终成为了浪潮信息在 8 月 24 号发布的“元脑生智”：大模型智算软件栈 OGAI（Open GenAI Infra）的一部分。如果用一句话解释OGAI 是什么的话，浪潮信息希望你把它理解为一个生长在浪潮信息服务器硬件上的，专门基于大模型开发的全栈全流程能软件套组。在硬件侧，它能够最大化实现对 GPU 算力的调用，软件方面则从炼大模型的一开始就帮助开发者提升效率。

OGAI一共分为五层，从 L0 到 L2主要针对的是大模型基础算力环境的效率提升。其中 L0 层是浪潮信息的智算中心OS，负责直接管理和分配算力资源，可以提供多租户的无损裸机算力环境。这有点像本地版本的云调度平台，宛如最底层的操作系统一样，面向大模型的算力需求实现对硬件的集中管理。

第二层 PODsys 是一个开源项目，它集成了系统环境部署的工具链。PODsys 有点像是长在初始化操作系统上的驱动程序，针对不同的环境和需求，实现从环境部署、系统监控和和资源调度的参数自动化配置。由于是开源项目，PODsys软件包大量集合了业界广泛使用的主流开源工具和框架，用户只需要执行非常简单的命令就能完成对整个算力集群的配置。

PODsys工具链是浪潮信息的首创，它实现的功能在过去是由人力来提供的，打个不太恰当的比方，它有点像是买组合台式电脑时工程师上门进行的驱动安装服务。随着整个数据中心行业向加速计算转型，对专家服务的需求也随之扩大，PODsys 这位“专家”的出现省去了用户在环境配置和优化上花费的成本。

L2 层是基础环境配置的最后一层，名为 AIStation ，它已经迭代到了4.0 版本，简单来说，它是浪潮信息研发的一款商业化软件，聚焦于对 AI 算力资源的精准调度。

大模型训练所花费的时间往往高达数十甚至上百天，因此对系统的算力、存储和网络的统一调度就显得十分重要。AIStation 支持单一集群数万个GPU 以及计算节点的介入和调度，有效把 L0 层已经池化的算力资源进行恰当分配以实现最大限度的调用效率，特别是它的断点自动续训能力，可以有效保证大模型训练的稳定性。

第四层名为 YLink。在基础环境构建完毕后，YLink精准对标大模型训练的 know how 问题。模型开发的两个环节，数据处理和模型训练在这一层都能找到对应的工具包，因此你可以把YLink当做浪潮信息专门为模型开发设计的能力支持层，标准化的数据处理工具、分布式训练框架和对应脚本以及微调用到的参数和指令调整都被集合在了一起，模型预训练的效率和微调的质量都将因此得到提升。

最后一层则是 MModel，它可以对各种版本和类型模型进行评估和管理，甚至还可以把它看做一个模型商店——开发者可以通过 MModel 分享自己的模型和数据集。

根据浪潮信息人工智能与高性能应用软件部 AI 架构师Owen Zhu的介绍，由五层架构组合起来的 OGAI 内部每一层的功能都是解耦的，不同的用户根据自身的场景可以按照需要独立选择每一层的功能。

当硬件厂商向上兼容

OGAI 可以被看作由硬件厂商基于硬件和自身经验所设计的一种端到端的大模型解决方案。

“OGAI 等于是把浪潮信息的模型能力平台化构建出的一种解决方案。”发布会现场的一位厂商如此向品玩表示。五层架构完整地覆盖了从最底层的算力调度到模型发布的全流程，理想情况下，开发者基于浪潮信息的硬件环境就能实现大模型开发的“开箱即用”。

在这五层架构中，PODsys 和 YLink 层都属于业界首创，尤其是 PODsys 层，在此之前没有人用一套完整工具链实现对算力基础环境配置的能力。或者你可以这样理解，只有类似浪潮信息这样的硬件提供商才有能力和动机提供这种一揽子套件，因为浪潮信息不仅足够了解硬件，同时也积累了足够丰富的商业化落地经验。

在分秒必争的大模型竞赛中，这种经验成为了浪潮信息十分独特的优势，它极大缩短了服务器集群设置所需要的时间，等于间接为模型开发提速。

我们可以看到，由硬件厂商和算力提供商，而不是软件服务集成商，主动推出大模型解决方案实际上已经成为了一种趋势。国内百度云和阿里云都各自上线了相关的模型服务和社区，国外的云厂商，从巨头如微软 Azure 到初创公司 CoreWeave 都在努力降低算力的使用门槛，用户使用浏览器就能方便地一键调用其算力用于大模型训练。

而依靠在 GPU 领域享有几乎垄断地位，进而在 AI 时代大赚特赚的英伟达实际上也在通过密集发布各种软件方案来促进大模型技术的广泛落地，比如和DGX 等英伟达服务器集成在一起的由几千个加速库和工具套件以及集群管理软件组成的英伟达 AI Enterprise ，以及 8 月刚刚由黄仁勋亲自发布的，整合了原本分散在各处的大模型开发工具与流程的英伟达 AI Workbench，这些方案的最终目的都是尽可能让开发者聚焦于高效训练模型本身。

但无论云厂商也好，英伟达也罢，它们的解决方案都有各自的弱点，云的方案在非常强调本地化的中国市场有各种水土不服的情况，尤其是在数据和隐私安全性方面。英伟达的解决方案尽管是同它的硬件能力结合的最好的，但一方面CUDA 生态本身是闭源的，而另一方面，不管是出于成本还是地缘政治现实的考虑，更多的用户实际上更需要的是跨多种硬件的，开源的解决方案。

由此，浪潮信息的 OGAI 站在了一个独特的位置上。一方面它满足了本地化部署的需求，另一方面这套解决方案并不是如行业最近热炒的“AI 一体机”一样与硬件进行了深度绑定，实际上这套方案本身都是解耦的，也就是说，尽管OGAI 是一套端到端的，囊括了产品和工具链的完整服务，但在具体使用的过程中，它完全可以依照开发者的需求进行非常自由的搭配，浪潮信息只是提供了一个解法，足够可靠，但并不唯一。

它是一个最懂大模型商业化落地场景的基础设施提供商，为这场百模大战贡献的独一无二的答案。

给文心一言做标注，一个月4000元

品玩

油醋

2023年8月29日 10:06

“有多少智能，就有多少人工”。

戏谑的话藏在人工智能背面，目前为止依然成立。刚从大学里走出来的丁洋，前途暂时踩在这后半句上。

丁洋大学时学的轻化工程，毕业后系里同学的去向大多是三班倒的造纸厂，他不想去工厂。今年6月份毕业后，丁洋从回到海口，8月初拿着一本电子版训练题库，两天后成为文心一言的“新手”数据标注员。

海口市秀英区的招商局大厦，文心一言的数据标注员们习惯把这里叫做“基地”。两百多人在这个基地进出，分布于这桩写字楼的其中三层，入职前要签保密协议，进门要刷脸，一人一台电脑，不少电脑还是老板从山西租了运过来的，因为在当地租这些设备熟人不多。

“这电脑买来500块钱都不用，我有次把主机拿去闲鱼上搜——就值60块钱。500块我能装一个比这好得多的。”

丁洋高考时候报的计算机，后来被调剂到了轻化工程，但他感兴趣的不是这个，反而在大学时看了很多计算机和软件工程的东西，这也让他在去年年底很快听说了ChatGPT的出现。

12月，他注册了个ChatGPT账号，然后“能力比较超出我的预知”，他说。

我在基地的工位碰到丁洋的时候，他眼前电脑屏幕上的问题是：“成功人士的标准是什么？”

这可能是某位文心一言用户的真实问题，也可能是凭空生成的一个测试题，但摆到屏幕前了，需要被标注。

标注并不容易。

一个这样的问题下面会有五个文心一言给出的不同回答。数据标注员要看完，然后把每个回答里所有的瑕疵都找出来。

比如回答中的错别字或者“因为”“所以”之类的逻辑词错用，但更多是答非所问，或者某段话里出现了完全没有事实依据的所谓“幻觉”。

他要给这五个答案按回答质量打分，满分5分，一共五档，最低1分。3分及以下的回答，丁洋需要把每处错误各自划分到标注系统给出的不同错误类型里。

这复杂的纠错过程是在训练生成合适的奖励模型RM（reward model，也叫偏好模型），打分和排序的动作会让模型进一步与人类的偏好对齐。

这也是ChatGPT的取胜钥匙，OpenAI的论文中曾描述过这个在指令微调（Instruction tuning）过程中让人工智能向人类想法对齐的过程。

在数据标注员的工作之前，需要一些更专业的人员把发散的语料变成具体的问答对，然后像例题一样喂给大模型，后者在大量问答对的数据训练之后得到优化后，开始自己答题。

数据标注员在这一阶段为大模型生成的答案质量从安全性、准确性、相关程度等角度做出评价，这些评价数据进一步训练出一个奖励模型。最终这个奖励模型会代替人工标注的工作。

OpenAI超过300亿美元的估值背后，是大量时薪不到2美元的肯尼亚数据标注劳工，要不然它在去年12月也到不了丁洋面前。

但丁洋并不知道RM或是SFT之类的定义，他说上手前的培训中没有这些过于理论的内容，这里甚至有人不知道自己为之工作的文心一言是什么。但这不要紧，要紧的是把事情做完。

这份早九晚六，做六休一的工作，底薪1800元。一个月下来，如果平均每天能标注够40道题，底薪就拿到了。底薪按完成率算，提成则要把正确率也考虑进去。多来一段时间的“老手”的稳定工作量是一天7、80个，遇到的问题难度也高些。平均下来，一个月可以拿到4000元，如果努力一点，比如每天标注100道题左右的话，一个月可以拿到7000元。

对于丁洋这样刚毕业的学生来说，4000元算是一份起步不低的工作。海口人平均月工资只有3000元出头，甚至10个人里有6个人一个月拿不到3000元。本地有名的后安粉要卖11元，ChatGPT的标注员干一个小时能买一碗。相比之下，粉算贵的。按他的话说，海口人钱赚的不多，但在吃东西上舍得下手。

“股票是最难的，或是汽车”，丁洋说。碰到这方面的问题一道可能就要花20分钟。

“比如会有人问是该买宝马3系还是奔驰C系”，这时候大模型会把关于两款车的80多个参数统统列出来去给用户比较，他就得跟在屁股后头去一一核实每个参数的真实性。

工作半个月也标注了大几百道题了，但他说自己印象里能拿到3分就已经不错，鲜有4分的。

他记得一道拿到4分的题，题目是“林黛玉为什么要打白骨精？”

文心一言没顺着竿爬，反应过来打白骨精的不是林黛玉，然后再介绍了林黛玉和白骨精各自的人物背景。从回答质量的各个维度来看，这都几乎无可挑剔。

我把这个问题提给了Claude 2，它说：“白骨精化身为王熙凤多次羞辱林黛玉,林黛玉对白骨精的戕害感到愤怒。”——幻觉这件事确实够麻烦的。

2020年初，“人工智能训练师”正式成为职业并纳入国家职业分类目录，两年后大模型的浪潮突然在这个目录上划开一个更大的口子。

眼看着人工智能拿走人类的旧工种，然后寄希望于它会创造出新的。就像那个马车被汽车取代，新工业会给马车车夫一个劳动致富新世界的笼统比喻，大把揣着钱找标的的投资人对这个说法买账，也有人不买，比如曾经奠定深度学习基础，现在却忧心忡忡的英国人杰弗里·辛顿。

但眼下最直接的创造就是丁洋这样的大模型数据标注员。

在2022年之前，那个人工智能前沿阵地仍然被驾驭不了自己的自动驾驶所定义的时期，对于数据标注员有一个冷冰冰的比喻：

“如果你把AI看成动物的话，数据标注员的工作大致就相当于准备饲料。”

这个工作便宜，重复——甚至够不上是个喂饲料的。

一个传统的数据标注员，每天的工作仅仅是仔细地观察每张接收到的图像，圈出一辆汽车或者一只狗的轮廓，打上标签，拖放到不同的文件夹里；或者用点阵工具将一段行驶录像中每一帧画面里的障碍物标记出来，留出一个完整的“可行驶区域”。

这样的动作一位数据标注员一天可能要做2000次。

只有经过标注的数据才能被人工智能学习。一家自动驾驶数据供应商曾表示，数据标注发展至今，自动化的程度仍然只有5%，另外95%的标注工作仍是以人工完成。

大模型来了之后，数据标注这个工种本身也开始变化。不只是对着屏幕简单的拉框、描点或者划线，大模型数据标注员主要的工作变成对生成内容的评估、排序和打分，如果涉及多轮对话或是多模态的内容生成，难度又陡增。

如果说传统CV和NLP时代的模型标注更倾向于按照客观规则行事，大模型的标注规则要主观的多，也更考验标注人员的素质。也因为这样，百度在海口和山西的大模型标注团队里全是本科以上的。

海口基地里的普通标注员有机会晋升为质检员，再往上可以做培训师，再做主管，最后则是项目经理。这是一条几个月内建立起来的通道。一位在海口为文心一言做数据标注的代理商表示，过了试用期后，内部有岗位就可以晋升，没有时间线。

这是个极速成型的新行业。“每一个环节上都是新人”，丁洋说。

质检员做完第一道审核后，会把题库交给第二道审核。第二道审核是百度内部来审，这些训练数据也就脱了丁洋所在标注团队的手。

为文心一言工作的丁洋和整个基地的200多人，算不上是百度的员工。

海口基地里的标注人员归属于四个不同的代理商。他们的劳务合同是和这些第三方数据标注公司签的。这是这个岗位的惯例，百度从搜索到自动驾驶到大模型的漫长人工智能历史，背后是全国超过600多个代理商，遍布300多个城市的20万数据标注人员。

百度给自己大模型专职团队的规模预设接近万人，这个计划将会兑现成未来全国十多个城市的新的“基地”。

百度智能云数据标注基地业务产品负责人胡驰相信，大模型数据标注员将会是一个长期的职业。随着大模型能力在各个场景深入，新的问题会出现，也意味着新的标注需求会出现，人类永远需要这样一种勤勉的对齐方式。

丁洋说，他会离开这儿的。

和他同一时间进来的新手数据标注员有20多人，很快已走了大半——多半是主动离开。工作内容的枯燥、计件工资的赚钱方式、对人的消耗，不难想象这会是个高流动性的岗位。而且不管再怎么有人叫好，人被机器取代的不安全感就在那里，这是所有人喜闻乐见的。

丁洋把这里看作一个能跟着这个产业一起成长的机会。“试试看能不能做到主管”，他说，然后去找一个离这场人工智能浪潮更近的位置。

（文中丁洋为化名）

工业机器人，引而待发

品玩

薛良Neil

2023年8月28日 16:34

说起工业机器人你会想到什么？恐怕许多人的第一反应都是那种庞然复杂，充满着赛博风格的机械工厂，人形机器面无表情的指挥、挪动各种复杂机械结构，然后变魔术地生产出各种产品，从显示器、汽车到手机和电脑不一而足。

显然，这种科幻风格还不能立刻变成现实，尽管人们已经在很多地方，比如汽车加工和半导体制造领域，实现了相当程度的自动化流程整合，但这些领域，尽管大多自带“高科技”光环，生产的产品附加值高、利润丰厚，但它们其实只占庞大驳杂的工业产业链中非常微小的部分，在纯粹的制造业产品生产线之外，还有包括物流转运、仓储管理等许多泛工业领域，它们都还广泛处于自动化兴起的前夜。有业内人士向品玩指出，全球物流的自动化率都尚不足 5%，中国则更低。更何况，就算是在所谓先进制造领域，完全的自动化生产同样也处于刚刚起步的阶段。

事实上，就连工业机器人具体指的是什么，长什么样，不同的人给出的答案也不完全相同——这再次需要回归到复杂的工业流程本身。不同的场景，不同的需求，这些过去都有赖于人来完成的复杂调度和流程衔接，现在都需要自动化的机器来完成——这让机器的形态变得千变万化，甚至它往往不单纯是一个物理的实体，还同时存在于数据的洪流、预设的算法以及协同的软件中，它们一同演变成了工业生态的一个环节，力图实现商业社会中人所永恒追逐的东西——效率的最大化。

一切都在蓄势待发。

一、四面墙内

旷视科技把自己的工业机器人场景设定在所谓的“四面墙以内”，也就是封闭空间的货物储存区域。

在国外，这种自动化物流项目已经非常成熟，旷视物流业务事业部产品业务解决方案负责人李帅给我们用冷链配送举了个例子：国外每万人拥有冷链配送车辆是国内的十倍以上。这背后是整个冷链物流产业链在中国发展羸弱的结果，反映出国内物流自动化水平的落后。

在旷视看来，当然意味着机会。旷视是做计算机视觉识别算法出身的，在由软算法转向硬的设备中，物流恰好成为最契合旷视技能点的场景之一。

整个物流业占据了 GDP 10%到 15%的份额，李帅介绍到，而旷视所对准的四面墙物流场景，尽管在整个物流中——如果你把干线物流也算进去——占比不大，但却是亟待提升效率的地方。

在机器人介入之前，四面墙物料的储存与物流都依靠人来执行，这不仅是一笔连年增长的成本开支，由人介入的物流实际上还面临着复杂的管理问题：一方面仓储领域的人员流动性颇高，还很容易受到季节性因素的影响，比如农忙和传统节日会带来定期的用工荒，这直接干扰了物流的效率。

另一方面，由人主导和介入的物流无法实现规模效率——当仓库的 SKU即存货单位多到一定程度时候，仅仅靠人是无法实现对物料的精准的操控与盘点整合的。

换而言之，在四面墙内，人力所能及的部分是有天花板的，到了一定程度，规模和效率都无法扩大了。然而这却恰好是机器人所擅长的地方。

旷视的解决方案包含了自研的托盘四向车、料箱式堆垛机以及各种物料自主移动机器人，组合起来全面替代了仓库中人所出现的所有地方，而从接收物料、传递物料到堆放和取货这些对物料的精准识别都依赖于算法，这又恰好是旷视最擅长的领域。

旷视开发的名为河图的软件平台能同时控制几十台游离在仓库中的物料搬运机器人，加上输送线系统，整个四面墙内都能实现“无人化”。

旷视认为通过软硬件配合，这套解决方案能用更高的效率调度

3到 5 年内，布置这些工业机器人的成本就会被抹平，随后，传统上被认为是花钱的后勤部门甚至可以转化为一个营收项目，“靠生产就可以持续盈利了。”李帅说到。

更重要的是，这些封闭区域里互相衔接、协同配合机器人突破了人力效率的天花板：2020 年，旷视对广州一家规模庞大的药品物流中心进行了无缝升级，在不停工的情况下实现了整体效率25%的提升。

当然，这不是说工业机器人的开发是一套放之四海而皆准的“通用方案”，当这种全自动化的仓储物流方案嵌入大型物料的配送中心或者生产物流线边仓库，成为了制造流程的一个环节时，强烈的行业属性就自动凸显了出来，这意味着你需要针对每个行业独特的特点而进行优化。

冷链物流是一个经典的例子，要让机器人能在零下 20 度环境顺利运行，那么所有的零件都要进行宽温设计，特别是要能经受巨大的温度变化——有人作业的区域平均气温往往是零上 10 到 15 度，这意味着机器人穿行不同的区域要能经受几十度的温差。

而仅仅是硬件上的设计还不够，有些行业 know how 只有深入场景，换句话说，实地操作才会懂得。比如在冷链物流中，两个不同温度区之间的过渡地带往往充斥着水蒸气和小液滴形成的水雾，这会直接影响摄像头的精准度。

再比如，冷链严格的温控要求意味着系统设计机器人行进路线的时候连它们本身的发热都要考虑在内——旷视的方案是通过算法让机器人的运动轨迹分散化，从而防止聚集形成的高温突破冷链的温控要求。

当然，所有针对场景的设计优化中，旷视最擅长的还是自己的老本行——AI 视觉算法。

众所周知，药品的流通有着严格的监管规范，仓库里出去一盒药至少要经过两个独立环节的核对，而旷视在其中一个环节实现了对人工的完全替代——用摄像头就能精确实现对药品名称、种类、批次的检验，旷视的算法优势在这种环节中显露无遗，据李帅透露，前期的算法适配只需要三五个人就可以完成。

不仅是对人力的替代，算法辅助下四面墙内的物流要素，在机器人的帮助下都实现了人力所不能及的效率提升——比如对整个库房的快速盘点。价值几个亿的货物，上万个托盘堆叠的货架，机器人可以在很短的时间内就完成所有的盘点，省掉所有的人工环节。

旷视也把算法看做自己最大的优势，用旷视内部人的说法，这被称之为“从软切硬”，尽管 2019 年才正式涉足物流领域，但在更早的 2015 年旷视就已经在进行硬件的开发。

“外挂 AI 算法的软硬件协同能力根本不能跟自研软硬件解决方案相比。”而这种协同能力在四面墙围绕的仓储物流领域的想象空间还十分巨大，甚至，旷视认为它将会占据自己整个业务量的四分之一乃至三分之一。

二、一个运筹学问题

如果粗疏的对工业仓储物流领域进行区分，大致可以分为制造业领域和商业领域，后者聚焦于产品本身的流转——它不再是生产过程的一个环节，而是对生产结果的物流分配，在一个综合仓库——比如物流中心和核心仓，物流分配的效率直接决定了品牌的经营效率。

最典型的场景是电商仓库，如何准确、快速、高效的让千差万别的货物从仓库顺利进入干线物流就是这个细分场景需要解决的痛点。

我们都有过这样的经验，在 618 或者双十一来临的时候，物流系统“爆仓”了，所谓爆仓，也就是仓库中的货物无法及时传递到干线物流网络中去——这往往是由于人手不足所导致的。在巨大的仓库中用最短的时间和路线找到对应的货物这个过程，过去是由仓库工作人员凭借经验来执行的，当客户的订单蜂拥而至时，这些经验显然不足以覆盖电商场景井喷式的需求。

灵动科技致力于解决这个问题。这家经历过多轮、累计融资近 10 亿人民币的移动机器人公司，是京东最大的第三方机器人提供商，有数百台 AMR 移动机器人游走在京东的库房。灵动的机器人策略被称为“订单到人”，也就是说机器人根据订单量和库房物料的分布情况自动到对应位置备货，过去仓库中需要许多人在固定动线上重复走动的情况被机器代劳，现在只需要少量的人在相对固定的区域和机器人配合装备货物就能实现比过去高得多的物流效率——2020年底在京东上线的第一个月，效率就提升了30%，第二个月则来到了50%。

由于依然需要人的参与和搬运，这种解决方案适用的仓库物流更多是非标品的小件和中小件，也就是边长小于 72 公分，重量小于 30 公斤的货物——这几乎覆盖了绝大部分电商和高端物流场景，它们仓库中的货物种类繁杂多样，许多甚至连摆放方式都不相同，而由于人和机器人要在巨大的货仓中协同工作，这对机器人的自动化水平提出了很高的要求。

灵动采用的方案是所谓第四代技术，也就是基于深度学习的视觉导航。机器人身上的传感器不只有激光雷达，还有摄像头，灵动的算法让机器人通过深度学习采集到的信息来识别货仓这样的封闭空间中的所有东西——无论是人，货架还是行进路线中出现的其他机器人，并自由穿行其中。

这种技术和乘用车上用来实现自动驾驶的技术本质上是一样的，因此你甚至可以把它当做一种“区域限定版”的工业自动驾驶。

“只有我们的四代机可以。”灵动科技的CEO齐欧说到，在这里他指的是限定区域内的自动混行。不要小看这种混行能力背后的技术含量，这意味着它不仅能和别的机器人共同运行，还能与仓库中的其它由人操控的设备，乃至人一起协同运行，这就让过往非常复杂的中小件精准物流动线规划，变成了一个纯粹的运筹学问题——系统只需要从理论上得出运动路线的最优解，剩下的机器人可以自主自动完成。

这非常像是滴滴或者美团对于运力资源的调配，本质上后台系统在实时监测每一辆车、每一个外卖员的运行轨迹和每一个客户、每一个店家的运力需求，最终，算法会得出一个全局运力分配的最优解，它会随着交通状况、运力需求变化等随时变化，灵动的方案也是如此。

当巨量的电商订单涌入时，灵动的系统会根据需求实时测算机器人行进的最佳路线，显而易见，这是道复杂的数学问题，仅仅是这种调度策略的开发，灵动就用了超过一年的时间，但它带来了巨大的回报，因为同制造业机器人不同，流通领域仓储物流对工业机器人来说是一片蓝海。

中国是全球制造业的中心，这种中心地位很大程度上来自低成本优势——中国拥有大量廉价劳动力，从某种程度上讲，这阻碍了机器人在制造领域的扩张——如果用人力和用机器人差不多价格（甚至更便宜），为什么要用机器人呢？

但对电商仓储物流来说，情况完全不是这么回事。中件仓的传统工作模式是由人拉着搬运车在仓库中游走。搬运车的负重是200公斤，而由于行进路线事实上是靠人的经验来规划的，每天人步行的距离甚至堪比一个马拉松！在没有空调的库房里，这种近乎极端的工作强度让它的流动率高达30%，也就是每三个月所有的员工都会换一波，因此，低成本、快速收益的自动化方案对他们来说几乎是一个必选项——仓库运营中有45%的成本都来自人工。

这是一个自动化率不到5%的行业，而灵动是国内目前唯一拥有完整订单到人解决方案的移动机器人提供商。

三、突破数据孤岛

关于机器人，优艾智合的定义与别家不同，他们扩大了机器人这个定义的外延，把它设想成了一种接近于独立的完整生产力形态，而不再仅仅是一个酷炫的先进生产工具这么简单。

这种机器人独立形态的标志是完全不需要人的介入，因此从外部看来，这种机器人更像一个完全独立自动运行的智能工厂，用优艾智合机器人联合创始人兼工业物流总经理许瑨的话说，在这里，物质流和数据流形成了一个完善的闭环，这突破了工业生产过程中的数据孤岛问题，也是机器人相对人工来说最大的优势。

可以想见，这种高度自动化、智能化的机器人形态意味着要打通制造业生产流程中的所有环节，不仅技术门槛高，成本也更昂贵，让它天然就更适合于单位产品价值更高的先进制造业，比如半导体晶圆制造和新能源电池。

许瑨举了个例子，晶圆制造有7道标准的工序，每一道工序本身已经非常成熟且实现了自动化，但工序之间的物料搬运，过去都是依赖人力。

这正是数据孤岛形成的原因，每道工序本身是独立且分离的，但整个制造过程又需要高度的流程化，因此人不得不参与其中，但人力辅助的工艺流程让数据流又充满了断点，这带来的直接后果是工厂不得不大量囤积原材料来保证生产过程的效率不会受到影响。

“很多生产企业，库存水平居高不下就是因为这一点。”许瑨说道。

解决的方式就是用机器人去打通全部原本孤立的环节，从原料仓到各级生产线的串联再到最后的成品仓，最终数据流的断点将不复存在。

这种精细程度已经不能用“打通最后一公里”来概括，恐怕“最后一米”更贴切。

继续用晶圆制造来举例，每道工序之间，就连简单的上料和下料也有固定的标准，更不必说还有半导体行业广为人知的对洁净度的极致要求——优艾智合的机器人需要运行在 Classes 100 的环境中，也就是说每立方英尺内，灰尘颗粒不能超过100颗。

为了打通这“最后一米”，需要实现对行业 know how 的深入理解，优艾智合的10多个研发工程师在客户现场旁租了房子住了一年半，先后迭代了4个工程版本的解决方案。

“哪怕机器在物理层面已经完成了90%的转运，只要有人的介入，从数据层面上讲，它依然没有突破，它还是创造了一个个的数据孤岛。”优艾智合最终的解决方案是复合型的，除了移动机器人，还加上机械手臂，传送滚轮等各种机械结构以及视觉算法和传感器，它们共同建立一个完整端到端的工艺流程闭环，它已经成为了优艾智合在半导体自动化领域最强的企业护城河。

如果你去问行内人对目前工业机器人发展的前景，恐怕会得到很多五花八门的答案。一方面，不确定的大环境与消费的疲弱显然波及了整个制造业与物流行业，每个企业在花钱的时候都要仔细的计算ROI，但另一方面，这或许意味着更廉价的智能替代方案将会成为主流——依赖低成本劳动力的时代正在过去，工业机器人的企业都在试图说服客户，单笔投入高，但长远来看回报率优异的机器人是一个好的选择。

我们现在就正站在这样的时间节点上，面前的是一个驳杂庞大，又蓄势待发的工业机器人江湖。

迅速逼近ChatGPT！Llama 最新代码生成模型已经直追GPT-4了

品玩

李欣帅

2023年8月26日 19:39

在发布开源可商用大模型Llama 2之后，Meta日前正式发布该模型的编程版本Code Llama，极大弥补了之前在代码任务上表现不佳的短板，进一步拉近了与闭源的GPT模型的差距，测试效果直追GPT-4。

值得一提的是，就在Code Llama发布的两天前，OpenAI开放了GPT3.5的微调功能，允许开发者和企业根据自己的需求定制模型。作为目前开源和闭源领域综合实力最强的两个大模型，这不免存在些许你追我赶的竞争意味，甚至是有一丝火药味？

编程作为大语言模型最重要的应用领域之一，也是当前几乎所有技术产品和服务都离不开的，对该能力的优化和改进具有重要意义。

本次发布的Code Llama是在Llama 2的基础上，通过特定的代码数据集进一步训练而来，支持C++、Java、Python、PHP、Typescript（Javascript）、C#和Bash等众多流行语言，依然是开源可商用。

Code Llama对编程专家和初学者都非常有用，无论是用专业的编程语言还是用自然语言（如普通话）来描述编程需求，Code Llama都能理解，并很好地生成相应的代码或与代码相关的解释。这极大降低了开发门槛和效率。

多版本模型覆盖更多特定场景需求

根据Meta的博文，Code Llama分为7B、13B和34B三个不同参数版本，可满足不同的服务和延迟要求。每个版本的模型都使用了500B tokens与代码相关的数据进行训练。

最小的7B参数模型可以在单个GPU上运行，响应速度快，适用于需要低延迟的任务。但相比更大的模型，在代码生成或理解方面不够精确。最大的34B模型能提供最佳的编码辅助，在复杂的编程任务中表现最好。但需要更多的计算资源，延迟也可能更高。中等规模的13B 参数模型在性能和延迟之间提供了一个平衡点。另外，7B和13B的模型经过了中间填充（fill-in-the-middle，FIM）功能的训练，能够理解如何在一段现有的代码中添加新代码，可以直接用于自动代码补全等任务，无需额外的设置或训练。

Code Llama支持一次性理解并记住最多10万token的上下文，强大的文本处理能力对于处理大型代码库或长篇文章都非常有用。比如，当开发者需要处理大量代码时，可以将整个代码片段一次性“喂”给Code Llama。

值得一提的是，为了满足更多特定需求，Meta还进一步针对Python和自然语言指令微调了两个Code Llama的变体，分别称作Code Llama-Python和Code Llama-Instruct。

Python是目前最受欢迎的编程语言之一，在多个领域有着广泛应用，特别是在数据科学、机器学习等领域。一个专门针对Python的模型能更准确地生成和理解Python代码，提高模型在处理相关任务时的性能。

另一个子版本Code Llama-Instruct更注重理解自然语言指令，非常适合那些不是很熟悉编程但又有这方面需求的用户。这个版本更容易理解用自然语言给出的指令，也就是更适合非专业用户，除了可以用于代码生成，也能胜任其他与代码相关的自然语言处理任务，如代码注释或文档生成。

通过提供更多垂直的子版本，Code Llama模型能够覆盖更广泛的用例和人群，满足不同场景下的特定需求，更容易获得竞争优势。

不过，Meta也有在博文中说明，由于Code Llama更专注于代码任务，因此并不适合作为聊天或写文章等日常语言任务的基础模型，它主要是为了帮助人们编程或处理代码问题而设计的。

性能和安全性双领先

而有关Code Llama的具体性能，在多个代码基准测试中，Code Llama达到了开源模型中最先进的性能。Code Llama所有模型在MultiPL-E上都优于其他公开可用的模型。34B参数版本在HumanEval上得分为53.7%，在MBPP上得分56.2%，这与ChatGPT（GPT 3.5）相当，优于其他所有开放解决方案。

在安全性上，Meta采取了许多措施，为做评估，研究者特意用一些指令请求恶意代码，测试Code Llama是否会生成不好的输出。并对比ChatGPT做了同样的测试。结果显示，Code Llama更不容易生成有问题或者有害的代码。

Meta还发表了一篇详细介绍Code Llama的论文（题为Code Llama: Open Foundation Models for Code），披露了Code Llama开发的细节以及如何进行基准测试等信息。

值得一提的是，在Meta发布的论文中出现一个名为“Unnatural Code Llama”的模型（见上图），各项评分都非常之高，但该模型只在论文中一闪而过，Meta并未提及，或许后续Code Llama会迎来进一步增强。

更多详细内容可以参看论文：

https://arxiv.org/abs/2308.12950

我周围的同事，都在“偷偷摸摸”的把笔记本换成平板

品玩

lzh

2023年8月26日 12:00

我发现了一个有趣的现象，身边有不少同事，已经开始逐步使用平板电脑来办公。记得在之前选题会上，就发现几位同事每天随身携带的设备已经从笔记本变为了平板电脑，这在一水儿的苹果logo面前确实足够显眼。

究其原因，是因为不论从随身便携性还是功能，这类平板电脑已经有替代笔记本的常用功能的能力，而且平板的特殊扩展性也赋予了其更多灵活性。当然还有必不可少一点，和动辄5、6千元的笔记本相比，大多数中端平板即使配齐键盘和手写笔套装也不过2K多元，价格优势明显。

另外我也发现，大家对于平板讨论最多的话题，并不是哪个视频网站看视频最爽，也不是玩游戏适配如何，而是如何使用平板+键盘+手写笔来提高记录效率。

我的同事跟我说，使用平板电脑很重要一个原因，是重量和续航要比他之前使用过的小米笔记本整体要强不少，而且更灵活的大小和更方便的拆卸方式也能满足他不同需求。

他首先和我提到的是屏幕尺寸，11英寸在他看来是随身设备的“黄金尺寸”，因为8英寸的mini平板虽然小巧，但因为应用字体过于小巧而牺牲了良好的阅读体验；也不像13英寸虽能同屏显示更多内容，但配上键盘后的重量和便携性跟笔记本并无区别。

像我手中的vivo Pad Air，屏幕为11.5英寸，屏幕比例为3：2，这个比例的一大好处是在连接键盘横向使用时，更加接近笔记本观感，尤其在一些网页显示时能显示更多内容。

配套的官方键盘和传统笔记本电脑键盘的体验感觉并无明显差距，一方面是1.3mm键程回弹感清脆，另一方面18mm键距下依旧容纳了64键位，虽然比较紧凑但写个文章还是没问题的，而且vivo还贴心地设置了Windows和Mac两套快捷键位，简而言之，它可以让你忘记这是vivo平板，获得和Mac一样的操作体验。

但凡使用过键盘加平板的用户，都知道即使配置再高，也逃不过只能打打字的命运，虽然很多键盘都具备了一键录音转文字功能，但使用场景过于单一，身边使用过这项功能的用户也聊胜于无。

而且如果想利用好平板，键盘+手写笔是一对天生组合，键盘负责长文章输入，手写笔负责查阅记录整理资料，这样的搭配并不分先后顺序，而是同步进行，比如列好文章大致提纲思路后，利用这次新发布的vivo Pencil2勾选摘录一些资料，之后汇总到原子笔记进行汇总就能进行快速查阅，使用起来还是非常方便的。

vivo Pencil2搭配vivo Pad Air使用书写感觉和延迟控制得不错图源：品玩lzh摄

我看了不少笔记达人都在推荐各种各样的笔记软件，什么云记、印象笔记等等，我也尝试下载了这些应用，发现这些软件都有非常漂亮的模板、字体、手写笔工具等等，而且提供的工具过于琐碎，这对于职场人来讲，想要利用碎片化时间学习就太过耽误时间。

而vivo自带的系统软件，比如原子笔记、原子阅读、电子书、笔记/文件软件就足够日常使用，配合额外的一两款软件，比如思维导图和无限画布，已经能够覆盖到全场景应用中了。

vivo自带软件搭配一两款第三方软件就能覆盖多数使用场景字不好看大家凑乎看图源：品玩lzh摄

比如收集一些日常选题思路，或者临时受到启发，我就使用享做笔记中的“无界笔记”功能，立马记录下来，之所以更加青睐于无界功能，是因为这样不会受到屏幕制约，而且能够瞬时记录下来“瞬时”想法，另外也可以在这个想法周围进行一些补充和拓展，这样最终呈现方式，就相当于思维导图。

这样对于记录一些头脑风暴想法确实足够方便，但因为是纯手写，所以像我这样写字并不好看的用户在分享给他人后，其他人可能并不能完全看懂，因此我建议还是使用标准机打字形式进行撰写。

很多小伙伴估计再写完提纲后，都有想转为思维导图分享给其他人需求，这里我推荐个宝藏软件幕布APP，它可以快速把提纲转化为思维导图，一目了然，而且只要注册就可以免费使用30天。

虽然vivo Pad Air在我折腾下已经有了替代笔记本的“生产力”能力，但毕竟现在是多设备办公时代，比如我就是同时使用平板和MacBook Pro，大家都知道安卓和苹果相互传软件始终是一件特别麻烦事情，而使用vivo系统的好处就在于，在Mac上安装vivo办公套件后，就可以把图片或者文章资料无缝传输到vivo Pad Air上，这样的跨平台软件目前vivo做得相对好一些，而且传输速度和延迟经过几代更新后，也有了明显改善。

“买前生产力，买后爱奇艺”不冲突

虽然vivo Pad Air已经通过键盘、手写笔这类硬件配置以及便捷的原子系统套件、vivo办公套件这类软件来增强了办公属性，但对于绝大多数人来讲，平板电脑依旧离不开它的娱乐属性。

在我看来，买前生产力和买后爱奇艺是可以共存的，没必要觉得生产力就物尽其用而看个视频就浪费平板价值了，这是一种非常刻板的印象，甚至在有些时候，平板的影音娱乐体验在一定程度上反而会超越笔记本或者一些家用电视的体验，原因有两个：

其一、目前很多安卓平板已经在入门价位中搭载了高刷技术，比如vivo Pad Air作为vivo入门款，就搭载了144Hz高刷屏，而且还覆盖了P3广色域，支持10.7亿色显示，色彩覆盖范围广，分辨率也高达2800×1840，这样在平板中看视频要比在同分辨率下的电脑或者电视上要更细腻。

其二、如vivo Pad Air不仅搭载了四个低频非常有劲儿的扬声器，还支持3D 实景⾳频，可以理解为把耳机中的空间音频技术带到了平板中，这是很多笔记本和传统电视都无法实现的功能。

这里我就以刚登陆流媒体的《速度与激情10》来举例，三款主流的国内流媒体软件，优酷、腾讯、爱奇艺在购买了各种SVIP会员后都需要再花钱购买，不过在这短短的6分钟试看时间中，我发现爱奇艺不仅提供了4K画质，还提供了杜比音效，借助3D 实景⾳频可以带来不错的环绕立体声体验；优酷则提供帧享120帧，整体观感最流畅；腾讯视频虽然提供了臻彩试听，但画面远没有高帧数带来的爽感直接。

所以我建议追求画面流畅度的朋友购买优酷视频（淘宝88会员换一个也可以）；追求画面色彩和声音体验的朋友购买爱奇艺即可。

小结：

不难看出，vivo Pad Air针对目前平板电脑应用较为广泛的办公场景、娱乐场景进行了深层次的优化，比如在设备轻量化方面，屏幕显示比例、键盘适配上都往PC端靠。

这样的做法显而易见，就是为了减少PC办公带来的割裂感，同时在软件方面，通过平板大屏触控优势，以及系统对于软件和手写笔的优化，来增强部分场景效率，加之高像素、高刷新率的屏幕提供了更加出色的显示效果，也突出了这款平板的影音娱乐优势。

现在AI没意识，不代表以后没有！图灵奖得主Bengio最新论文：技术已不是障碍

品玩

李禾子

2023年8月24日 19:39

人工智能会发展出意识吗？

今年年初ChatGPT的热潮席卷全球的时候，这一度还是许多人关心的问题（另一个问题则是AI会不会让自己失业）。不过这种恐惧和危机感，后来很快就被各种让人眼花缭乱的大模型产品取代了，绝大多数人在焦虑未来和关注眼前之间选择了后者。

不过59岁的Yoshua Bengio依然在关注这件事，就在当地时间本周二，包括他在内的一个19人团队刚刚发布了一篇长达88页的重磅论文，来论证现在的AI有无可能拥有意识。

论文地址：https://arxiv.org/pdf/2308.08708.pdf

Bengio曾在2018年因深度学习的相关研究获得图灵奖，被认为是人工智能领域先驱式的人物；论文的其余作者也都是来自人工智能、神经科学和哲学领域的教授和专家。

先看结论：这篇论文认为，目前并不存在拥有意识的AI，但是以现有的技术条件，创造出有意识的AI基本不成问题。

光是一句话就足够让人汗毛树立。这就好像，昨天我们还在说能在虚拟小镇里相安无事像人一样过生活的AI智能体，明天这群AI智能体就开始想着小镇外面有什么、真正的人类世界是什么样之类的事了……

是福还是祸，我们不如先来看看这篇论文的研究方法。

首先必须指出的是，关于什么是“意识”，虽然每个人都能大概讲出一些自己的理解，但在学界，意识的概念长达几个世纪以来都存在不同的定义。哲学家、神学家、语言学家和科学家对这个概念进行了数千年的分析、界定、诠释和辩论，但意识的本质仍然统一的认可、留有争议。

人工智能领域对于人工意识的理解也经历了漫长的演进。

20世纪以来，以艾伦·图灵为代表的行为主义者曾贡献了这一领域最具影响力的对意识的定义，也就是著名的“图灵测试”——如果一个测试者对无法确认身份的两个对象（一人、一机器）提出相同的一系列问题，得到的答案让他无法区分究竟谁是机器，谁是人，那么则认定机器通过图灵测试，拥有意识。

行为主义的特点是，将意识解释为一系列能被外部观察到的行为，以行为来定义意识。但这种方法也被诟病忽略了心理现象，无法解释智力。

功能主义后来取代行为主义，成为新的定义人工意识的主导思想理论。和行为主义相比，功能主义更关注大脑做了什么以及大脑功能在哪里起作用——如果有任何东西可以模仿特定的心理状态与计算过程的因果作用，意识就是可以实现的。

功能主义也对事物如何工作、到底是由怎样的材质组成等等外化体现不感兴趣，就好比将任何能报时的东西都归为时钟一样，而时钟是什么制成的并不重要，只要它能报时就行了。

尽管功能主义也被认为存在无法体现事物的思考性等问题，但它依然是现在人工智能领域较为主流的衡量AI是否存在意识的依据。

后来美国哲学家、计算机科学家Hilary Putnam又将功能主义与计算概念结合，提出了计算功能主义。简而言之，计算功能主义认为，精神世界是基于一个使用诸如信息、计算（思考）、记忆（存储）和反馈等概念的物理系统（即计算机）。

而Bengio等人此次发布的论文，对AI有无意识基础的判断依据正是计算功能主义。

基础原则确定之后，接下来就进入到了更细致的“打分”环节。因为此前，学界对意识的研究已经有了一些公认的结果，比如科学家和哲学家对意识必要条件的主张等等，论文作者在研究中做的事情就是，从过往对意识研究的成果中选取一部分科学理论，作为判断AI是否具有意识的更具体的评估依据和指标。

论文主要介绍了其中用到的循环加工理论（Recurrent Processing Theory，RPT），全局工作空间理论（Global Workspace Theory，GWT）和计算高阶理论（Computational Higher-Order Theories，HOT）三种科学理论。

以循环加工理论（RPT）为例，研究者将这一理论具体拆分成了RPT-1和RPT-2两个指标：RPT-1指“使用算法循环的输入模块”，RPT-2指“生成有组织、整合的感知表示的输入模块”。

在衡量一个AI有无意识时，要做的就是将其性能和这些指标进行对照。

以下是论文中详细列出的其他科学理论指标：

当然这一步并不是真的去给一个AI打分，而是要看这个AI能够同时满足以上多少指标。研究者同时也指出，判断AI有无意识并没有绝对的答案：

为了方便起见，我们通常把意识写得好像是一个要么全有要么全无的问题。然而，我们对这种情况的可能性持开放态度：一个AI系统可能是部分有意识的，或者既不是完全有意识的，也不是完全无意识的。有许多属性具有“模糊”的边界，就像一件衬衫可能是介于黄色和绿色之间的一种颜色，这样就没有关于它是否是黄色的事实。

此外，论文中也提到此次研究使用了偏理论的研究方法。这其实也和计算功能主义的原则相对应，偏理论指的是去评估AI是否满足科学理论指标中的功能或架构条件，而不是去寻找他们某些具体的行为特征，“对于AI意识研究来说，一种重理论的方法是必要的，重理论的方法是专注于系统如何工作，而不是它们是否显示出可能被视为有意识存在特征的外在行为形式”。

以上便是这篇论文用到的研究方法。

论文的下半部分也提到了一些具体的研究案例，来体现判断特定的AI系统是否具有意识的研究过程，其中就包括了基于Transformer的大语言模型和Perceiver架构，还分析了DeepMind的Adaptive Agent（一个在3D虚拟环境中运行的强化学习智能体）和谷歌的PaLM-E（一个经过训练可以操纵机器人的多模态视觉语言模型）。

不过最终结果显示，这些AI系统并没有体现出非常明显的有意识的倾向。

研究者同时写道，“我们研究的证据表明，如果计算功能主义是正确的，有意识的AI系统实际上可以在近期内建立起来。”

论文发表后，英伟达首席AI科学家Jim Fan第一时间便转发了这一消息，并表示了他对研究团队的敬佩，

“ ‘意识’一直都是AI领域大家讳莫如深的话题。这篇由图灵奖得主Yoshua Bengio参与撰写的88页论文，是对意识科学理论以及当今人工智能堆栈中可能实现的系统调查，我赞扬他们有勇气去解决这个大多数研究人员都会回避的争议性话题。”

事实上，作为世界级的人工智能专家和深度学习先驱，Bengio近年来的研究课题许多都和人工智能的意识问题相关——

2017年，他曾在arXiv上发布过一篇题为《意识先验》（The Consciousness Prior）的文章；2019年的NeurIPS大会上，他又发表了《从System 1深度学习到System 2深度学习》的主题演讲，提出了一个在当时让人印象深刻的观点：深度学习正在从直观的、无意识的静态数据集学习，向具有意识、推理和逻辑的新型架构研究转变。

而在今年3月，Bengio也参与了那场轰轰烈烈的反对各家人工智能实验室搞AI“军备竞赛”、要求其暂停至少6个月比GPT-4更强大模型研发的运动，和其他超过千名的产业和学术大佬一起在公开信上签了名；两个月后，他又发表了一篇系统分析“危害人类的AI是如何出现的”的文章。

直到这次联合发表这篇长达88页的论文，Bengio一直都在不遗余力地做那个想要警醒大家AI的未来该向何处去的人。

就像这篇论文里写到的那句话，“这篇报告还远未对这些（AI有无意识的）话题做出最终定论。我们强烈建议支持对意识科学及其在AI中应用的进一步研究。我们也呼吁，社区应尽快将建立有意识的AI系统的道德和社会风险纳入考量（尽管这并不是这篇报告所强调的主题）。”

英伟达业绩冲天，看来只有黄仁勋能打败黄仁勋了！

品玩

薛良Neil

2023年8月24日 19:38

Key Points

1、英伟达本季营收135亿美元，不仅远超5月份发布的业绩指引，也比分析师普遍预期的业绩要好，受此利好，英伟达股价一度抬升超过8%。

2、英伟达强劲增长的势头将延续，下一季营收预计高达160亿美元。英伟达强劲业绩表明，生成式AI带来的影响或许比一般人想象的更大，可预见范围内看不到需求下降趋势。

3、之前普遍预计的产能问题并没有拖累英伟达营收，黄仁勋表示英伟达正在通过和其他公司合作等手段力图提升产量，本年度剩下的时间和明年英伟达产品的供应将“大幅增加”。

4、英伟达提供了完整的加速计算解决方案，既包括硬件，也包括各种软件服务。这维护了英伟达在市场中的领先地位。短时间内还看不到任何竞争对手能系统性挑战这一点。

以任何标准看，英伟达的最新财报都让人震惊。

截止 7 月，英伟达本季收入同比增长翻倍达到 135 亿美元，贡献了 103 亿收入的数据中心业务营收暴增 171%。利润同比增长超过 800%，环比也超过 200%。

上述指标每一项都高于华尔街分析师的预期，与此同时，英伟达给出下一季营收预测更让市场震惊，160 亿美元的营收预测意味着高达 170%的同比增长，在如此重大利好消息的推动下，英伟达股价强劲上涨 8%，冲破 510 美元关口。

这份财报意味着英伟达的增长远没有到尽头，市场对于生成式 AI 爆发意味着什么的理解可能还不够充分。

一、超越所有预期

财报发布前，英伟达的股价大致在 460 美元附近，而主要券商和分析机构对英伟达股价的预测大致位于 500 到 520 美元之间。随着财报的发布，英伟达股价极速上扬，直接冲破了 510 美元关口。这让分析师们给出的预测显得过于保守。

这还不是英伟达打败的唯一预期。本季度135 亿美元的营收比英伟达自己在 5 月底给出的指引高了 25 亿美元，也比分析师们平均预计的 125 亿美元多了 10 亿。

换而言之，大家想到了英伟达的业绩或许会很好，但未曾预料到会好到这种地步。毕竟上个季度英伟达的总收入只有不到 72 亿美元（数据中心业务则是 42.8 亿美元）。指望一个硬件公司，一个季度的营收提升一倍（如果只算数据中心业务的话，提升超过 145%）这看上去当然不太符合常理，过去 11 个财年，英伟达的季度收入都没有超过 100 亿。

然而事实已经雄辩证明，你显然不能用常理去理解英伟达和黄仁勋，实际上，本季度的营收是历史性的突破，是整个半导体业界史上最大的单季增幅。

换而言之，整个市场都低估了生成式 AI 的爆发带来的影响。

二、避险情绪与对需求的理解

市场相对的保守态度，一方面体现出了对生成式 AI 爆发理解的不充分，另一方面代表了一种避险情绪。

先说避险情绪。除了 AI 芯片外，整个半导体需求都在走弱。英伟达在整个半导体行业和科技股中几乎处于一枝独秀的状态，它是标普 500 指数成分股中表现最佳的股票，今年美股上涨的主要推手，起到几乎定海神针般的作用。

整个市场依赖一只股票的表现这显然不太正常，因此在业绩发布前的一个月英伟达的股价涨跌互现，显示市场游移不定的情绪，因为英伟达的业绩哪怕只是稍不如意，恐怕就会引发整个股市剧烈震荡。

更何况英伟达还有产能的问题无法解决，更长期看，对 AI 芯片的需求在何时见顶也是个问题。

在财报发布前，市场上已经开始有把英伟达同思科相提并论的论调，思科是上个世纪末互联网泡沫中跌幅最大的股票之一，而在泡沫破裂前，它的增长曲线和英伟达如出一辙，而它们俩恰好还都是硬件公司——推高思科股价的原因是人们当时认为思科提供的基础设施对建设互联网来说是必不可少的，这也很像大家目前对英伟达的理解。

这就回到了对生成式 AI 需求的解读上，也是财报电话会上黄仁勋被问到的一个核心问题——生成式 AI 带来的增长在多大程度上是可持续的？

黄仁勋给出的逻辑是这样的。全球目前的数据中心规模是 1 万亿美元，而每年的资本支出规模在 2500 亿美元左右，这些支出在整个经济大环境下行的背景下，都倾向于导向最为经济、最有性价比的方向，也就是加速计算，英伟达在这方面拥有优势，包括 H100、A100 在内的整个HGX 系统是营收最大的驱动力。

因此，对需求的可预见性至少在明年是充分无疑的，当然如果你完全接受老黄的理论的话，数据中心更新换代的周期将长达 10 年。

趋势非常明显，平台正在转变。英伟达不遗余力为市场的预期带来充分确定性，这种确定性从财报的营收上反映了出来，截至目前所有的信号都是高度乐观的。

黄仁勋在 SIGGRAPH 2023 大会上展示最新的基于 GH200 的超级计算机。

三、解决产能

在这份财报击碎了市场有关需求泡沫的任何不确定性后，人们的另一个关注点就来到了更实际的层面——产能。

英伟达不直接生产芯片，HGX 系统中最重要的芯片 H100 采用了名为 CoWoS 先进封装技术，目前只有台积电能够提供。

换而言之，目前 H100 供应如此紧缺的最大原因就是 CoWoS 产能不足，它也是市场上某些悲观论调的来源，决定英伟达产能的很大程度上并不是英伟达自己，而是台积电。

根据品玩了解到的情况，台积电已经在台湾多地布局了先进封装产线，公开报道中最新的一个位于台湾新竹科学园区，但量产时间预计要到 2027 年第三季度。

这种进度的缓慢除了技术工艺上的复杂性之外，台积电对CoWoS 产能扩充缓慢也和其自身运营逻辑有关，尽管 AI 需求未来五年将以 50%年均增长率成长，但它的总需求只占台积电营收的一成左右。在整个半导体行业需求不振的情况下，台积电产能扩张步伐显然只能循序渐进。

英伟达解决产能瓶颈的办法是扩大供应商范围，在电话会议上黄仁勋表示英伟达会“与其他公司合作以补充台积电的封装能力”，尽管一如既往，英伟达没有给出任何明确的数字，但总体来看，今年下半年和明年，芯片的供应量将“大幅增加”。

这符合半导体产业周期，一般来说芯片产能都会提前6 个月左右规划，这个季度是订单反映到财报中的第一个季度，随着计划好的产能逐步扩张，下个季度营收势必会相应提振，这正是英伟达给出 160 亿美元下季度营收预测的基础逻辑。

英伟达另一个旨在解决 CoWoS 产能问题的对策是推出 L40S 芯片，尽管它同样适用的生成式 AI，但却没有采用CoWoS 技术和高性能内存，这意味着它的产能更好提升。

在 8 月的 SIGGRAPH 2023 上刚刚推出的时候，有人一度认为L40S将会打乱英伟达的产品线——L40S 在大模型性能方面比 A100 还强。但黄仁勋在电话会议上明确否认了这种观点：L40S 的定位更倾向于对预训练模型进行微调，同时它采用了标准化设计，因此很容易安装和进行超大规模的扩展，这和 H100 构建的专门的大规模语言模型训练的系统是不同的。

四、是产品，更是解决方案

对 L40S 产品定位的诠释，充分展现了英伟达对整个加速计算产品线的布局与理解。

首先是迭代迅速，黄仁勋几度谈到了英伟达产品的更新周期——不是 2 年，而是 6 个月。这种黄仁勋速度本身就让人印象深刻，5 月在台北电脑展上介绍的DGX GH200年底就会上线，GH200 芯片则在本季度就会出货，它的升级款，8 月刚刚发布的采用更先进内存的 GH200 芯片则在明年 2 季度出货。

就像每两年升级架构一样，有规律的更新速度实际上稳定了所有人对英伟达产品性能的预期。

另一方面值得指出的是，英伟达的产品线实际上不是围绕算力，而是围绕加速计算本身展开的。它本质上是一种软硬件协同的解决方案。

H100、A100、L40S 以及RTX 系列 GPU 以及 DGX Cloud，它们涵盖了从训练大模型，到微调，再到数据科学工作流，以及三维设计和数字内容创建等各种需求，算力布局从本地到服务器再到云端无一遗漏。

但这不是英伟达加速计算解决方案的全部，名为 InfiniBand 的网络技术可以大幅提升网络吞吐量从而更好提升扩展 GPU 的性能，针对传统的以太网，英伟达也能用 Spectrum-X 技术来加速优化。实际上英伟达的技术储备涵盖了加速计算的多个方面。其中许多技术被放在了产品中，并没有单独售卖。

软件方面也是如此。仅就大模型来说，英伟达还有开发大语言模型的 NeMo 平台，名为 Picasso 的生成式视觉模型，为游戏角色提供智能对话能力的 Avatar Cloud Engines，以及 AI Enterprise 等加速库和预训练模型套件等等一系列工具，它们基本上也都集成在了英伟达的硬件产品线中。这些软硬件协同起来不仅可以实现对加速计算的端到端优化，而且强化了英伟达在加速计算领域的优势。

竞争对手或许可以在某些硬件指标上领先英伟达，但无法在整个生态层面同英伟达竞争。

五、对手还未出现

英伟达在发布财报时宣布了 250 亿美元的股票回购，这意味着英伟达自己对股价的展望也趋向乐观。

最激进的分析师已经给英伟达的股价给出了 1000 美元的估计，整个市场都因这份出色的财报弥漫着一股显而易见的乐观和兴奋情绪。目前看，包括 AMD 和英特尔在内的竞争对手都没有对英伟达形成真正的挑战：AMD 的 MI300系列产品要到第四季度才出货，根据品玩从供应链了解到的情况，也采用了CoWoS 技术的AMD 新GPU不仅同样受困于产能瓶颈，而且在良率提升方面进度远远落后。至于英特尔的 Gaudi2 芯片，它在软件层面的优化升级要到四季度才能完成。

因此，这份出色财报发布的时间点，恰好落在了英伟达独享生成式 AI 爆发红利的区间，目前看，这波增长还没有任何慢下来的趋势，站在独孤求败位置的英伟达真正的对手或许只有自己。

市面上最好的降噪真无线耳机，都在这了

品玩

lzh

2023年8月24日 14:54

不知道从什么时候开始，每天出门前我必备的三样物品只剩下了手机、耳机、充电宝。

移动支付的发展让用户不在带着钱包和现金出门，智能门锁的普及也让很多人再也没有忘带钥匙被锁在家门外的烦恼，可以说手机从一个单纯的通讯工具进化到多媒体娱乐中心设备后，不带手机出门就感觉和少穿了一件衣服一样。

虽然蓝牙耳机不是苹果发明的，但是现阶段它这么流行绝对是AirPods带火的。如何选择一个合适的耳机保证你在通勤路上拥有一段“安静的时光”，是各大厂商都在绞尽脑汁思考的一件事儿。

虽然之前我在无数篇文章里面已经说过了，如果没有特殊要求，买谁家的手机就在他们家的耳机里选一款看着顺眼的就行，但不得不说有些手机厂商的耳机做的是真的差劲儿，再加上老牌厂商的发力，让这个市场再度活了起来，其中最火爆的，就是索尼和Bose。

前段时间索尼推出了全新的第五代“降噪豆”——WF-1000XM5，这让很多还在用3代的小伙伴心里痒个不停，毕竟用过3代和4代的用户都知道索尼的佩戴感有多么的“灾难”，第5代是否从根本上解决了这个问题？和目前市面上的明星产品AirPods Pro二代与Bose大鲨二代相比又有什么区别？

就在我苦思冥想要找出一个测试这三款旗舰降噪耳机方法时候，正好赶上出差，飞机的噪声环境其实非常适合测试耳机的综合效果。于是我想都没想，直接抄起这三款旗舰真无线耳机就上了飞机。

这三款耳机的官方售价都是1000多块，全都买来体验未免太过“奢侈”，想要在这三款耳机三选一的朋友，不妨仔细来接下来的内容。

一、降噪真是关键

咱们先来聊聊大家关注的周围降噪问题，首先需要明白一点，噪声从哪里来？

简单来讲，对于我们这样的上班一族来讲，在通勤路上，除了汽车轰鸣声、地铁轨道摩擦声以及飞机引擎声外，人声也是不能忽略的“噪音”。日常主要受到高频噪音和低频噪音的影响较多，其中诸如汽车鸣笛、广场舞、狗叫以及周围说话的人声属于高频噪音；而老式火车、变压器、飞机轰鸣和汽车发动机声则可归类为低频噪音。区别就是，低频噪音传播距离更远，穿透力更强。

在飞机到平流层后，我详细对比了这三款旗舰降噪耳机，索尼降噪豆5和Bose大鲨二代的降噪效果确实要占有一定优势，周围乘客的人声高频噪声和飞机发动机的低频噪声是可以同时被“消除”的。

但如果仔细听，索尼降噪豆5和Bose大鲨二代两者“消噪”主观感受却不一样。

索尼降噪豆5和Bose大鲨二代两者都可以对飞机低频噪声进行抵消，但对于中频人声策略很不一样：

索尼是不管是低频、中频、高频都能进行消噪，非常彻底。这样确实有不错的消噪效果，但如果遇到一些突发情况，很有可能就会错过一些人声语音提醒。

而Bose大鲨二代的飞机低频噪声可以抵消，但较为尖锐的人声还是有所保留，这样就能听清空姐说的服务提醒（不愧是做飞行耳机的牌子）；苹果AirPods Pro的表现就比较一般了，即使塞的很紧我仍然能听见飞机轻微的机器噪声。

值得注意的是，索尼这次确实通过全新研发的HD降噪处理器QN2e和新一代集成处理器V2加强了整个降噪能力，但如果把降噪档位开到最大，就会听不到像飞机上乘务空姐说的话，所以我还是建议在日常使用时打开AI智能降噪模式，让耳机通过AI基于不同场景来学习，自动切换降噪和环境音。

此外在通话过程中，索尼降噪豆5也会借助神经网络技术和骨传导技术，带来干净、突出的语音通话背景，这项新加入的技术确实对实际通话会有一定提升。

二、舒适的佩戴和操作体验

从便携性上来看，索尼降噪豆5相比上代耳机充电舱小了约15%，耳机腔体小了约25%，重量仅为5.9g。尽管体积缩小，但降噪豆5依旧保留了强劲的续航和快充能力，在打开降噪时，一次充电可以满足约8小时耳机使用实际，充电盒可以额外提供约16小时的续航时间。

并且，这次索尼的佩戴舒适度终于可以和AirPods Pro“媲美”了。更加贴合耳道的设计让耳机整体更贴合皮肤。这次索尼新增了适合小耳道的SS号耳塞，在适配性上更加宽容。

而Bose大鲨鱼二代的“稳固环”在长时间佩戴后会依旧非常舒服，我佩戴的最大号耳塞也没有任何顶到耳廓的拉伸感。

当然在像飞机这样的容易引起“幽闭症”的环境下，与耳机的交互操作越简单越好，如果使用的是苹果手机，那么AirPods Pro深度集成进iOS系统的UI界面自然不用多提，从美观和便捷度来看，依旧是目前真无线耳机天花板。

而像索尼降噪豆5、bose大鲨鱼二代这样的全平台真无线耳机，APP都为双平台，丰富程度而言，索尼降噪豆5配套APP最为详尽，特别是个性化智能均衡器的功能引入，可以根据几个简单的问题回答，就能筛选出最符合你喜好的音质，自动在不同的声音风格、细节、微调中进行设置。

这次索尼也新增了头部姿势控制的功能，通过这个功能可以完全解放双手，佩戴产品会根据头部的变动，实现诸如接挂电话等操作，不过在详细试用后，我发现功能设置还是有些繁琐，如果可以单独设置一页常用功能或许会更方便些。

三、沉浸感是最后的“救命稻草”

稍微了解一点音频的用户都应该明白，“环绕声”要比“双声道”带来的沉浸感高不少。除了AirPods Pro早已支持空间饮品以外，这次索尼降噪豆5同样支持360 Reality Audio，配合360RA格式的音源，开启后可以获得不错的空间音频沉浸感。这个功能开启后，声音的空间感会随着头部转动而移动，获得更好的环绕沉浸体验。

而Bose大鲨二代仅为双声道，看电影或者玩游戏就会缺少一定沉浸感。

索尼的APP界面可以调整的选项最多；Bose大鲨二代最简洁；AirPods Pro则很苹果

最后简单聊聊非空间音频部分音质，这次索尼降噪豆5声音要比上代通透不少，低频量感和高频延伸要更有张力，一方是振膜从6mm提升至8.4mm，增加了低频量感，另一方面振膜顶部膜片和振膜分离，会让低频和高频具有不错的动态范围，同时也会保持最低失真。

小结：

从今年市场来看，不管是像索尼、森海这样的传统音频厂商，还是OPPO、vivo、荣耀这样的科技品牌，似乎都“放慢”了速度，曾经更新频率和手机厂商有一拼的场面也不复存在。

各家似乎都把真无线耳机作为“年货”，就像iPhone一样每年更新。

我们做了一张表格，可以更加直观的让你对比三款产品的优劣，方便大家选择。

最后，对于应该如何选择的问题，我这里给出实际建议：

苹果用户直接选择AirPods Pro二代，如果你非常在乎全频段降噪和可玩性建议索尼降噪豆5；如果想找一款设置方便，通勤降噪效果最出色的真无线耳机，Bose大鲨二代是最好的选择。

OpenAI不藏着了，开放微调功能，不用其他工具就能搞一个你自己的ChatGPT

品玩

李欣帅

2023年8月23日 21:09

8月23日，OpenAI宣布推出基于GPT-3.5 Turbo的微调功能并更新API，让企业、开发人员能够使用自身数据定制ChatGPT。

微调（Fine-tuning）是一种利用已有通用语言模型（如GPT-3.5）来训练一个特定模型的方法。通用语言模型虽然具有很强的语言理解和生成能力，但是它们并不针对特定的领域或任务。通过在自己数据上对通用模型进行微调优化，训练一个专属模型，可以更好地适应特定的使用场景。在保留通用语言模型强大能力的同时，进一步提高模型的准确度等效果和效率。

这就相当于在一个已经建好的房子上进行装修，使其更符合自己的需求和喜好，而不是从头开始建造一个新房子。因此，可以节省大量时间和资源，也可以避免一些技术难题。

OpenAI此次推出的微调功能，使更多开发者能参与到GPT模型应用当中，并借此实现更多个性化和创新的应用场景，提高用户体验和粘性，这对开发者生态的建立也起到了积极的助推作用。同时也极大拓展了通用模型的应用范围和潜力，加快了各行各业部署AI技术的步伐。

对于此次公告中提到的GPT-3.5 Turbo微调的安全性、使用效果、价格、未来更新、部署步骤等方面，重点说明如下。

安全性：从微调API发送的数据归客户所有，OpenAI或任何其他组织不会使用数据来训练模型。同时，为了保障模型部署的安全，OpenAI通过审核API和GPT-4驱动的审核系统，检测与安全标准冲突的有害数据。（微调有利于为用户提供更具个性化的服务，但也降低了技术门槛，可能导致不负责任的使用）

微调效果：在实际测试过程中，GPT-3.5 Turbo的微调版本在某些任务上，与基本型号的GPT-4能力相当甚至要更好。微调客户能够提高常见用例的模型性能，并缩短提示时间。通过对模型本身的指令进行微调，还可加快API调用并降低成本，提示词数量减少了90%。

价格和Token：GPT-3.5 Turbo的微调成本分为初始训练成本和使用成本两部分。一个包含100K tokens训练文件的微调工作，预计成本为2.4美元。具体来说，训练：$0.008 / 1K tokens；使用输入：$0.012 / 1K tokens；使用输出：$0.016 / 1K tokens。可处理的上下文为4K tokens，是之前微调模型的两倍。

微调步骤：只需经过准备数据、上传文件、创建微调作业、使用微调模型四步。一旦模型完成微调过程，就可以立即在生产中使用。

未来更新：GPT-4 的微调将于今年秋天推出，而在秋季晚些时候会推出对GPT-3.5函数调用和16k上下文的微调支持。不久的将来还会推出微调UI，可更容易访问正在进行的微调作业等有关信息。

GPT-3迭代：OpenAI现在正在提供babbage-002和davinci-002型号作为GPT-3基础模型或微调模型。最初的GPT-3基础型号（ada、babbage、curie、davinci）将于2024年1月4日关闭。

总结来说，通过开放先进大模型的微调功能，OpenAI能吸引更多企业和开发者使用其平台和模型，从而扩大影响力和增加营收缓解亏损压力。这有助于AI产品得到更广泛应用，推动大模型加速落地。

同时，此次功能更新，也可看作是对Meta开源模型并允许商用等外部竞争的一个应对举措。通过允许微调模型，OpenAI可以进一步扩大和巩固用户基础，确保自身在行业的引领地位。这或许也会促使其他企业加快商业化步伐，行业竞争进一步加剧。

以下为OpenAI公告全文：

GPT-3.5 Turbo 的微调现已推出，GPT-4 的微调将于今年秋天推出。此更新使开发人员能够自定义更适合其用例的模型，并大规模运行这些自定义模型。早期的测试表明，GPT-3.5 Turbo的微调版本可以在某些垂直的任务上与基础的GPT-4功能相当，甚至要更好。与我们所有的API一样，从微调API发送的数据归客户所有，并且未被 OpenAI 使用或任何其他组织来训练其他模型。

微调用例

自 GPT-3.5 Turbo 发布以来，开发人员和企业要求能够自定义模型，以便为其用户创造独特且差异化的体验。通过此次发布，开发人员现在可以运行监督微调，以使该模型在其用例中表现更好。

在我们的私人测试版中，微调客户已经能够有效地提高常见用例的模型性能，举例来说：

改进的可操纵性：微调允许企业使模型更好地遵循指令，例如使输出简洁或始终以给定语言响应。例如，开发人员可以使用微调来确保模型始终按要求以德语响应。

可靠的输出格式：微调可提高模型一致格式化响应的能力，这对于需要特定响应格式（例如代码完成或撰写 API 调用）的应用程序来说至关重要。开发人员可以使用微调来更可靠地将用户提示转换为可与自己的系统一起使用的高质量 JSON 代码段。

自定义风格：微调是磨练模型输出定性感觉的好方法，具有可识别品牌风格的企业可以使用微调来使模型与其基调更加一致。

除了提高性能外，微调还使企业能够缩短提示时间，同时确保类似的性能。使用 GPT-3.5-Turbo 进行微调也可以处理 4K tokens——是我们之前微调模型的两倍。早期的测试人员通过将指令微调到模型本身，加快了每次 API 调用并降低成本，将提示大小减少了多达 90%。

当与其他技术如提示工程、信息检索和函数调用相结合时，微调的效果是最强大的。对这方面若想了解更多可查看我们的微调指南。另外，对函数调用和GPT-3.5-turbo-16k的微调支持将在今年秋季晚些时候进行。

微调步骤

我们还将在不久的将来推出微调 UI，这将使开发人员更容易访问正在进行的微调作业、已完成的模型快照等有关信息。

安全

对我们来说，安全地部署微调是非常重要的。为了在微调过程中保留默认模型的安全功能，微调训练数据将通过我们的审核API和GPT-4支持的审核系统，以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两类：初始训练成本和使用成本。训练：$0.008 / 1K tokens；使用输入：$0.012 / 1K tokens；使用输出：$0.016 / 1K tokens。例如，用100,000个tokens进行微调工作，预计成本为2.40美元。

更新的 GPT-3 型号

今年7月，我们宣布原始 GPT-3 基本型号将于2024年1月4日关闭。今天，我们正在制造这些模型的替代品，无论是作为基本模型还是微调模型。这些模型可以使用我们新的 API 端点进行微调。基本和微调的 GPT-3 型号的定价如下：

新的端点提供了分页和更多的可扩展性，以支持微调 API 的未来发展，过渡到更新的端点也非常简单，更多详细信息可参见我们的微调指南。