普通视图
国家航天局:到2027年,基本实现商业航天高质量发展
申菱环境:拟发行可转债募资不超过10亿元,用于液冷新质智造基地项目等
百思买第三季度营业收入96.7亿美元,同比增长2.7%
华为 Mate 旗舰新机上手:我们用 20 倍长焦微距,找到了一个小彩蛋
![]()
刚刚新鲜发布的华为 Mate 80 手机和一系列新品,爱范儿已经第一时间开箱上手体验。来看看今年最强华为手机,有什么亮点?
首先看华为 Mate 80 Pro Max,我们拿到的是「极昼金」配色。这次采用了全金属材质的机身,背面采用全新的双环设计。
![]()
不过下面的圆环并没有我们预想中的磁吸功能,主要还是起到一个造型上的作用。华为官方则推出了一个磁吸手机壳配件,佩戴上就能解锁磁吸能力。
![]()
机身上用金属光绘,在金属表面刻出了致密的纹路,用指甲刮一下是能听到声音的,我们用长焦微距放大 20 倍,甚至还能看到表面的纹理细节,华为藏的小彩蛋,也被我们找到了。
![]()
接着是这部华为 Mate 80 RS 非凡大师,新增的紫色相比黑白红来说,会更有个性一些。
![]()
Mate 80 全系列都改直屏设计,整机线条看上去更加硬朗,但边框过渡做得很顺滑,一点也不硌手。
![]()
Mate 80 Pro Max 和 Mate 80 RS 非凡大师搭载的的双层 OLED 屏幕有点东西,在 1% APL 能做到业界最亮的 8000nits,堪称闪光弹。
![]()
Mate 80 RS 非凡大师还支持全链路的 BT.2020 广域色彩管理,SDR 的图片和视频都能实时提升至 HDR 播放,肉眼提升很明显。
最后看新的大折叠华为 Mate X7 典藏版,我们手上这台同样是很有韵味的紫色,依旧是素皮材质,不仅耐用,外观也很典雅。
![]()
影像方面,这次发布的新机都搭载了第二代华为红枫影像,无论是 Mate X7 的四摄,还是 Mate 80 Pro Max 的双潜望五摄,都能实现超广角到超长焦的全焦段色彩一致,至于具体表现有多强,爱范儿后续也会为大家带来详细的影像评测。
![]()
形态有点意思的二合一平板电脑 MatePad Edge,爱范儿已经提前拿到手体验了好几天。
![]()
MatePad Edge 配备了一块 14.2 英寸的 OLED 屏幕,窄至 4.1mm 的窄边框、94% 的高屏占比,配上 6 扬声器,娱乐体验还是很沉浸的。
![]()
更重要的是,MatePad Edge 并非只有一面,只要在屏幕上四指滑动一下,我们就能看到它的界面顺滑的从平板模式切换到了 HarmonyOS PC 一模一样的电脑模式。
这时,只需要把 MatePad Edge 吸附到新款的「星跃悬浮键盘」上,你的 MatePad 就可以秒变笔记本了——一个运行 PC 版系统的「真 · 笔记本」。
![]()
更重要的是,两套模式共享一个系统基座,让 MatePad Edge 能够兼容平板和 PC 两种应用生态,比如这个过往由 Pad 独占的「天生会画」app,这次在电脑模式下也能使用了。
两种模式共享同一套文件管理系统——电脑模式下有什么文件,平板模式下都能访问;平板模式下画好的图纸,切换到电脑模式就能直接读取,创意和效率都能兼顾。
可以说,华为的鸿蒙二合一平板电脑,终于跳出了传统「二合一」电脑的框架,无论是平板模式还是电脑模式,都能提供 100% 的体验。
![]()
最后一个新品,我先不说是什么产品,看看大家能不能猜出来它的功能:
![]()
这,就是华为最新的路由器 X3 Pro,它打破了路由器要么很大要么很丑的常态,做出一个你会很愿意将它摆在眼前的造型,把自然景观带到你的桌面。
独特的雪山造型,搭配冷暖氛围灯光,能根据时间和天气自动变换光效——晴天是耀眼的阳光,夜晚是温馨的暖光,阴天雪天则是清冷的白光。
![]()
华为路由 X3 Pro 可不是一个中看不中用的花瓶,它支持PLC 电力组网,安装使用超方便。主路由插上电源和网线后,就能把网络传输到电路上,房子里只要有电的地方就有网,插上子路由就能拓展网络覆盖,没有预留网口的地方也能信号满格。
传统的路由器,我们在家装时总是费尽心思把它藏好,但华为路由 X3 Pro 却让我们想找个好位置摆出来,它既是设备,也是装饰。希望以后,这种用心做设计的产品能再多一点。
![]()
以上就是这波华为新品的开箱,对于 Mate 80 和 Mate X7 系列手机,以及 MatePad Edge,你还有什么想要了解的吗?欢迎在评论区留言,详细评测马上就来。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
昂利康:拟定增募资11.6亿元,用于创新药研发及产业化项目
贝莱德寻求将沙特投资增加一倍
印度企业Zetwerk已聘请投行,计划明年提交IPO申请
富森美:副总经理、董事会秘书被立案调查并实施留置措施
《疯狂动物城2》预售票房突破3亿
马斯克:Grok 5有10%概率实现AGI
诺基亚宣布从巴黎交易所退市预计于2025年12月31日生效
朗鸿科技:股东拟减持不超2%公司股份
智光电气:孙公司签订1.52亿元买卖合同
WISE2025 DAY2剧透:对话商业之王,求解商业生存法则!
![]()
![]()
WISE2025 商业之王大会DAY2议程公布!
![]()
![]()
WISE2025商业之王大会DAY2将试图直面企业经营者最迫切的需求,从破解碎片化时代的用户洞察难题,到科技驱动下的消费品类重构,再到全球化背景下的出海新策略,每个环节都围绕一个核心:在充满不确定性的市场环境中,如何建立一个真正跨越周期的商业品牌。
28日的演讲嘉宾,既有来自像尼尔森这样常年深入洞察一线的咨询企业,也有来自像华熙生物、麻六记这样的亲自下场从0到1建立品牌的掌舵人。
可以说,大会28日的议程,在试图描绘一套完整的未来商业作战指南。(DAY1剧透看这里👉本周在哪儿投资你的「商业注意力」?WISE 2025为你划重点!)
![]()
第四幕:认知游击战
——在碎镜子里打捞用户
我们正站在一个“镜像破碎”的时代,消费者散落在无数的屏幕与场景中,“忠诚度”可以忽略不计,爆品生命周期以秒为单位迭代。在这样的混沌中,品牌如何才能识别到真实的用户需求?大会28日的议程内容将试图探索答案。
大会开场,36氪首席内容官李洋将发表主题为:中国品牌时刻:从“存在感”到“定义权”的深度演讲。
![]()
大咖演讲|中国品牌时刻:从“存在感”到“定义权”
36氪CEO冯大刚与尼尔森IQ中国区董事总经理周凌卿将共同发布“国货未来超级品牌名册”—这不仅是一份名册,更是一份指引未来品牌竞争的战略蓝图,帮助企业在混沌中识别“真信号”。
![]()
发布环节|国货未来超级品牌名册发布
作为常年深耕消费洞察与品牌增长策略的研究者,尼尔森IQ中国区高级副总裁王斐将系统拆解“国货未来超级品牌名册”背后的方法论体系,在数据泛滥而信号稀少的时代,他将通过一套科学完整的方法论,不仅衡量当下声量,更预判未来的品类话语权。
![]()
大咖演讲 | 破土新生:国货未来超级品牌名册方法论与趋势洞察
华熙集团董事长、华熙生物董事长兼总裁赵燕以“共生的力量”为脉络,重新诠释中国制造与生命科学交融的下一章,她将叩问品牌如何在与用户、技术与时间的共生中,实现持续再生。
![]()
大咖演讲|共生的力量:中国制造与生命的再生
北京食通达科技发展有限公司董事长、麻六记品牌创始人汪小菲将以“五载川香 味浓如初”为题,讲述如何在五年时间里,让一味川菜穿越周期、成为国民记忆。它的背后,是一个关于“时间复利”的品牌叙事——在快时代,如何用慢功夫做“时间的品牌”?
![]()
大咖演讲|五载川香 味浓如初 麻六记的五年与未来
创维集团首席技术官、深圳市酷开网络科技有限公司首席执行官王志国将提出“从个体幸福到全域共振”的AI探索路径,分享AI如何从冰冷技术进化为“共情伙伴”。当科技开始感知用户情绪、营造生活仪式感,品牌的温度又该如何被重新测量?
![]()
大咖演讲|从个体幸福到全域共振的AI探索
36氪CEO冯大刚与OATLY大中华区总裁张春将围绕“破局东方”展开对谈,探讨全球品牌在中国市场的在地化逻辑——当“东方叙事”成为全球消费的新语法,品牌该如何用利用“中国文化”讲述世界故事?
![]()
大朋友|破局东方 全球品牌的中国发展
![]()
第五幕:我用科技做品牌卖爆了,
消费品的科技造神之战
2025的货架上只有两种产品:正在被科技改造的印钞机,和等待被淘汰的陈旧铁皮。当消费品竞争从“渠道为王”转向“科技赋能”,品牌具备“科技基因”已成为决定其发展好坏的关键因素。
第五幕将揭示AI如何成为品牌的“增长引擎”。飞书深诺集团创始人兼CEO沈晨岗将提出“营销+AI双轮驱动”模式,正在成为中国企业加速出海的新范式。
![]()
大咖演讲|营销+AI双轮驱动
小阔集团董事长、参半创始人、CEO尹阔将分享科技基因植入传统消费品类的实战路径:作为善于把技术注入传统品类的“行业老炮”,让老产品长出“新神经”是必备技能——你是否敢为你的产品,做一场“科技换脑”手术?
![]()
大咖演讲 | 科技基因植入激活传统消费
而在随后由尼尔森IQ中国区高级研究总监刘晓辉主持的深度对谈中,萌友智能联合创始人&CEO何嘉斌、趣丸科技人工智能首席科学家、趣丸千音CTO张强、星世线STARAY创始人&全球3D打印消费品品牌开创者骆洁、华硕电脑(上海)有限公司副董事长柯彬将共同探讨:如何用科技来催生“品牌创品类”?当产品可以被“算出来”、被“打印出来”、被“感知出来”,品牌的创造边界究竟在哪里?
![]()
Deep Talk|科技促新:用科技做品牌创品类
下一个环节由尼尔森IQ中国区首席客户官骆琦主持,汇聚来自食品、营养、餐饮与日化四大传统行业的革新者:华美食品集团总裁袁瀚钊、华大营养总经理张海峰、王春春鸡汤饭联合创始人高臻臻、上海和黄白猫有限公司首席营销官郁骢,他们共同回应一个命题:在品类不断被重构的今天,“老手艺”该如何嫁接“新思维”,才能不被时代抛下?
![]()
Deep Talk|消费蝶变-传承与创新
![]()
第六幕:出海不是远征是共生
蜂群思维,共生全球
“单打独斗”的出海模式已成过去,“生态共生”正成为新的关键词。当中国企业走向全球,如何摆脱“复制中国模式”的旧思路,转向真正意义上的“本地化共生”?
本幕将从数据、技术、战略到创意,层层拆解出海新逻辑。从尼尔森IQ发布的调研分享,到关于算力架构如何支撑AI应用全球落地的工程视角,再到一场覆盖营销、硬件与底层通信的圆桌对话,它们共同论证:2025的出海,不再是地理意义上的远征,而是以“蜂群思维”参与并重塑全球商业生态的进化历程。
![]()
大咖演讲 | 领袖蓝图:尼尔森IQ CEO调研分享
GMI Cloud VP of Engineering-Yujing Qian将分享AI出海背后的算力支撑。当地理边界被云端重构,什么样的基础设施才能支撑起下一个全球品牌的诞生?
![]()
大咖演讲 | AI应用出海效能升级:算力破局与推理架构进化
商汤科技高级产品总监、小浣熊家族负责人贾安亚将重新定义AI与人的关系:AI不只是工具,而是“重新定义生产力”。当机器开始思考,人的价值该如何重新锚定?
![]()
大咖演讲 | AI不只是工具,而是重新定义了生产力
当AI成为医生的外脑,医疗的边界将被推到哪里?罗氏制药中国医学部AI医疗产品开发团队负责人陈舒展将展示“当医学遇到AI”的融合场景—小罗智多星,是否是临床医生的“贾维斯”?
![]()
大咖演讲 | 当医学遇到AI:小罗智多星:临床医生的贾维斯
暗涌WAVES资深作者任倩、赛文思营销咨询创始人&CEO陈勇、一知智能消费事业部/出海总裁吴俊、智云CEO&产品总工程师廖易仑、星联未来SATELLAI创始人毛汉勇将共同探讨:当��单打独斗”成为过去,什么样的“生态共生模式”才能定义出海的未来?
![]()
Deep Talk | 新全球化时刻-出海不是远征是共生
数字王国中国区副总经理陈晓光将探讨“AI+创意”如何重塑内容生产格局。当技术能自动生成剧情、角色甚至情感,创意是否也将进入“可编程时代”?
![]()
大咖演讲 | 科技驱动创意:「AI+」正重塑创作格局
![]()
终章:锻造黎明
新科技时代即将开始
最终章在尼尔森IQ中国区首席客户官骆琦的演讲中开启。他将以:“通往2026:中国消费者趋势前瞻"为题,发布未来一年的关键消费信号与结构性变化——当多数人仍陷于碎片化热点的追逐,他的分享将穿透表象,揭示真正影响商业底层的“静水流深”。
![]()
大咖演讲 | 通往2026:中国消费者趋势前瞻
前奥美中国区首席增长官、繁荣学社创始人、头部商业博主“天使姐新商业”陈蓉将抛出“所有行业,都值得用‘超级个人品牌’重做一遍”的超级命题:当创始人成为品牌最强符号,你是否准备好成为你自己的“首席信任官”?
![]()
大咖演讲 | 所有行业,都值得用“超级个人品牌”重做一遍
真知创投合伙人、光联芯科CEO陈超将发表主题演讲,分享行业最新动态。
![]()
大咖演讲
在IPO加速营发布仪式上,36氪CEO冯大刚、RET睿意德创始人张家鹏、中伦律师事务所资深合伙人李海容、氪睿丰远创始人龚伟、容诚会计师事务所资深合伙人陈芳将在启动环节中隆重出席。
![]()
发布环节|IPO加速营发布仪式
11月27日-28日,北京朝阳798艺术区传导空间,我们WISE大会见!
特别感谢:问界M9对本届WISE大会的大力支持。
感谢爱企查为本次大会提供的特别支持。爱企查是专业权威的企业信息查询平台,致力于为用户提供一站式企业信息查询服务,始终秉持“让大数据服务社会,为建设信用社会发力,积极助力中小企业成长,促进经济社会健康持续发展”的产品理念。
感谢大会指定咖啡品牌库迪咖啡的大力支持。
鸣谢企业:感谢HOLOHOLO、神眸、轻成、HOLLYLAND猛玛、快造科技、汉王友基、果子熟了、韶音、OLEAP黄鹂智声、影石Insta360、参半、唱吧、TAGSIU、IMAX对本次大会的赞助支持!
![]()
本文来自微信公众号“36氪”,36氪经授权发布。
润建股份:正在筹划发行H股股份并在香港联交所上市事宜
中辰股份:控股股东拟减持不超3%公司股份
杨震原:2021 年字节团队曾训出大语言模型,但当时 “没眼光”
11月24日,在第五届字节跳动奖学金颁奖典礼上,字节跳动技术副总裁杨震原分享了公司的技术探索历程。
据其透露,2014年,字节跳动创始人张一鸣找到他表示想用大规模机器学习系统来搭建推荐系统,解决各种媒体形式,包括图片、文字、视频的推荐。被这个想法吸引的杨震原就这样加入了当时还是一家小公司的字节跳动。
杨震原提到,在 2022 年 11 月 30 日 ChatGPT 横空出世之前,字节跳动团队曾在 2021 年有过一次提前关注大语言模型的机会:当时字节跳动的一位同事已训练出一个大语言模型,但团队当时得出 “该大语言模型暂无实用价值” 的结论。
“所以还是很没眼光。”杨震原说道。
好在公司调整的很快,从2022年开始在这个方向投入至今,也取得了一些成果。“应用上大家可能更熟悉一些,豆包是中国最流行的AI对话助手,火山引擎的大模型服务也受到客户的认可,根据IDC的报告,火山是中国MaaS市场的第一名。”
![]()
字节跳动技术副总裁杨震原
以下为杨震原分享全文:
大家好,很高兴在字节技术奖学金,这样一个场合见到大家。我自己是一个技术爱好者,2014年我加入字节跳动。从最初负责搭建新的推荐系统开始,到现在已经有快12年了。这些年来,也一路参与了字节很多的技术探索。
说起字节,多数人比较熟悉的还是我们的产品,比如抖音、今日头条、TikTok等。
我的视角可能更技术一些,今天这个机会,我来以我的视角分享一些大家可能没那么熟悉的技术故事。
2014,大规模机器学习与推荐系统
第一版就计划做到万亿(T)级别的特征规模
最初,创始人张一鸣找到我,跟我说,他想用大规模机器学习系统来搭建推荐系统。来解决各种媒体形式,包括图片、文字、视频的推荐。他这个想法很吸引我。
2014年,工业界最大规模的机器学习系统,是搜索广告中已经成熟使用的大规模离散LR(Logistic regression)。把这套原理用在推荐系统上,挑战可不小。那时同时熟悉大规模软硬件工程和机器学习的人不多,而且,除了能够挣到很多钱的搜索广告会使用;其他领域,大家都不愿意花这么大的硬件成本去做计算。
我们第一版就定了一个非常激进的目标:计划2014年做到万亿(T)级别的特征规模。
这里有非常多的挑战,比如系统建模,处理好推荐的优化目标。工程上,存储和计算是最前期的门槛。另外我们也要做好算法的优化。构建目标,做好存储的挑战,以前都分享过了,今天说说优化算法。
![]()
图源企业
LR的优化是成熟技术,但不同的方法效率、效果差异巨大。尤其是超大规模之后。今天很多同学可能不知道当年的优化器的情况。今天 SGD系的方法是主流,但2014年,我们搞非常大规模稀疏的逻辑回归的时候,并不是这样。当时CD系的一些方法用的更多。另外,百度的搜索广告使用的优化器是OWL-QN。
我们当时一共就5个人,还有人要去做工程,优化器准备了2套方案。1、SGD-FTRL;2、CDN(Coordinate Descent Newton )。就选了两个人分别负责,同步进行调研。
CDN 优化器项目,我们当时预判比较有潜力,初期进展也不错,但最初的上线发现又不太行,就一直改进。2年中,始终有一个小组持续在做。直到SGD的方法都开始找到更多的应用方式后,才终于停了这个项目。CDN优化器项目组里的同学,后来转到了机器学习的其他方向,负责公司很重要的业务。虽然项目并不成功,公司还是很认可他们的探索。
FTRL现在提到的都比较少了,可以认为是基于累计梯度的,基于AdaGrad风格自适应的,L1正则的SGD。这个项目我们进展很快,几个月上线,成功实现了稀疏化万亿特征的目标,并且框架非常灵活。
14年底,我们逐渐引入了FM类算法,后来演化成了更通用的deep learning体系。而且从我们上线的第一天,它就是一个streaming training的系统。
到今天,我们发现streaming更新(training only)的、较浅层的神经网络算法在推荐中依然有着不错的效果。它可能和现在 test-time training中的一些问题相关,也许是更近似RNN的一个实现。
2020,科学计算的探索
求解薛定谔方程,就可以模拟世界绝大部分的现象。
大概 2019 年底到 2020 年,我们讨论过一次,未来AI还能够怎么发展,如何在全社会发挥更加重要的价值?
当时的思考是,只有很大规模的有价值的数据,才能够产生足够有价值的模型和算法。线上世界,推荐、搜索、广告是主流应用。那么,还有什么场景能够产生很多有价值的数据呢?显而易见是现实世界。但现实世界的数据搜集与应用会比较复杂,涉及到无人车、机器人等领域。除了现实世界,我们还想到一点,那就是科学计算。
我们这个世界虽然纷繁复杂,但底层的物理规律是特别简洁的。从量子力学的角度来讲,如果今天有一台计算能力没有上限的机器,我们确实可以从薛定谔方程中解出当前世界中绝大部分的现象(不考虑重力的情况下)。大量的simulation会得到有价值的数据,指导machine learning去进步。得到更好的结果,反过来,又可以改进simulation。
这张图是我们当时的顾问鄂维南院士分享过的一张图,我贴过来了,讲的是不同尺度科学计算的分类。
![]()
图源企业
大家可以看,横坐标代表了空间尺度,纵坐标是时间尺度。这张图代表了物理和科学计算的一些问题。比如最左下角的是第一性原理计算,它包括CCSD、 QMC 等方法,它需要去计算多电子的波函数。再上走,分别是做了近似的DFT(密度泛函)。再往上走,不再去描绘波函数。而是使用粒子来做抽象,也就是分子动力学MD(Molecular dynamics),再往上抽象到粒子团簇;最上面抽象的流体力学、有限元等更高抽象的层次。
那机器学习在其中的价值是什么呢?图中的L1、L2、L3、L4的意思是,在这些不同尺度的问题上,都可以通过机器学习的方法更好地求解。例如,在最下面量子化学计算角度,采用神经网络来拟合多电子波函数。尽管这些物理规律描述起来特别简单,但计算起来却异常复杂,所以机器学习能够发挥非常大的价值。
第一性原理计算
我们从 2020 年开始在这个方向持续投入。这里有一张同事提供的图,展示了我们在这方面做的一些工作。
![]()
图源企业
图中的横坐标指的是时间,这个领域早期代表性的工作是DeepMind的FermiNet等,2019 年我们几个人在会议室里就讨论过这项工作。这个领域叫做NNQMC(神经网络量子蒙特卡洛方法)。大概是什么意思呢? QMC 是量子蒙特卡洛,根据变分原理,任何试验波函数 计算得到的系统能量 总是大于或等于真实基态能量。于是,我们就可以用神经网络去表示一个波函数,然后,在这个波函数上进行采样并计算系统能量。然后,我们就可以按照能量更小方向的梯度去更新神经网络,最终得到一个更优的波函数表示。
粉色部分是我们在 2021 年之后的几项工作,我们基本上在业界已经做到前沿。
这张图的纵坐标指的是仿真精度,就是与物理实验的接近程度。仿真越接近真实,应用前景就越好。圆的大小表明了仿真体系电子的数量,这个圆越大,也就意味着它有更大的实用价值。
最右上角有一个Scaling Laws with LAVA,这是我们最新的一个成果。我们发现,这个问题和大模型一样表现出Scaling Law,如果我们使用更多参数,就会看到它的仿真精度是持续上升的。这是一个很好的信号,说明我们可能在实用性方面还有很大的突破潜力。
在处理体系范围上,我们提出了首个能使用于固体体系的NNQMC方法,DeepSolid。同时在二维转角材料的研究上也进行了一系列研究。今年的一个重点工作就是将NNQMC用于研究拓扑绝缘体。
拓扑绝缘体具有特别的电学性质,通电后,器件内部没有电流,但在器件边缘产生电流。器件几乎不发热。
拓扑绝缘体“不发热”这个电学性质十分诱人。因为现在用的CPU,GPU都会大量发热,造成能源损耗。如果真能用拓扑绝缘体替代,也许可以制造超级计算机。
怎么找拓扑绝缘体呢?应用上面的方法,我们就可以根据材料的描述,来仿真计算得到材料的性质。从而大大提高实验的效率。我们具体计算了MoTe2 这种二维材料,发现其在特定的密度和旋转角度θ下会变为拓扑绝缘体,并且与实验结果一致。
分子动力学
![]()
图源企业
我们在分子动力学上也有很多探索。MD(分子动力学)在鄂维南老师的图中是classic MD这个位置。我们的思路是,先改进正问题。使用更高精度的仿真来给机器学习MD的力场提供更精准的label。DFT(密度泛函分析),是一个合理的层次。我们首先做了DFT的GPU加速工作。我们的GPU4PySCF,实现了GPU加速DFT计算的业界SOTA。相比传统CPU计算程序,实现速度1GPU≈500~1000CPU core的加速,完成相同计算任务算力成本降低1个数量级。
有了更好的label,我们就可以获得更准确的力场模型,进而可以做更准的MD仿真,来做更好的性质预测。
当我们做了很多正问题后,我们就可以再次训练模型,去直接生成可能满足某些性质的小分子的候选,这就是逆问题。这个问题,就是若干工业领域(能源、制药)的核心问题了。我们的团队开发了Bamboo-MLFF和ByteFF两类分子动力学力场,对分子、固体体系的性质进行准确预测。其中ByteFF-Pol目前在无实验数据zeroshot预测电解液性质上实现了业界SOTA的精度。
这些工作不仅仅只在我们的实验里。我们今年已经和BYD成立了联合实验室,会将高通量自动化实验与科学计算算法结合,探索AI for Science在电池材料领域的工业落地应用。目前,GPU加速DFT计算、力场+分子动力学模拟、预测+设计模型均已投入企业合作伙伴的实际应用。
2021,PICO——XR的探索
更多投资基础技术,追求核心体验上大台阶
字节跳动的发展离不开硬件的革新和进步。大屏手机、高清camera是抖音、tiktok这样产品发展的土壤。那,接下来还有什么交互体验可以超过视频呢?
XR是有潜力能带来全新的体验。2021年,字节收购了Pico团队。
收购后,我们有两个产品路线在同时推进。一个是,以当前的产品形态为主,同时投入资源运营视频、直播等内容,较为激进的营销。路线二,是投资基础技术,追求核心体验上一个大台阶。
2023年,我们决定减少内容和营销投入,更坚定的投入技术路线。这是因为当时产品的硬件体验尚未成熟,无法支撑大规模市场应用。这个调整当时还带来了一些误解,不少人说字节不做这个方向了。其实恰恰相反,23年开始,我们在XR上的技术投入比以前更多。
接下来,我来分享一些路线二中的一些技术探索。
首先是清晰度。
XR要模拟人眼观察真实世界的体验,关键指标是PPD(每度像素数),就是说人眼睛看一个度(degree),大概有多少像素。这个指标和观看距离、屏幕 PPI(像素密度)强相关。
PPD 大于 30 大概可以看文字,40会比较清晰。PPD 到 60 的视觉体验接近视网膜级清晰度。在 2021 年,Pico 3、Quest 2 这些主流产品的 PPD 其实是小于 20 的,而且这还是中心区域,如果到边缘还要更差。如果一个 XR 产品无法看清楚字,那使用场景肯定就很局限,这是要解决的一个重要挑战。
2022年我们开始研究怎么能做好,最后决定和供应商启动MicroOLED定制。MicroOLED是一种在单晶硅片上制备主动发光型OLED器件的新型显示技术。相比于其他显示技术(如高 PPI 的 LCD 液晶屏),microOLED 在实现单眼 4K 等级的超高分辨率时,仍然能够保持更小的面板尺寸。这使得光学显示系统得以进一步缩小,从而让 MR 头显轻便的同时获得更高的 PPI 和整体清晰度。
![]()
图源企业
如果我们去对比iPhone,iPhone 17 Pro Max 是 6.9 英寸的,它的PPI是460。我们在 2022 年定制 MicroOLED 的目标是什么呢?我们要做到近4000PPI,大概是iPhone 17接近九倍的量级,所以这个事情的挑战是非常大的。
MicroOLED虽然可以有超高的PPI,但它每个像素点都特别小,导致屏幕亮度上限较低。我们通过导入微透镜(MLA)来提升亮度,副作用是色亮度均一性变差。这就需要,结合光学设计,通过主光线角(CRA)定制和系统性补偿上的一些工作,让亮度和色亮度均一性同时达到最优状态。
![]()
图源企业
在我们启动的那个时间点,市场上现有的产品在很多维度(比如分辨率、亮度、功耗、成本等等)都无法达到我们的要求。我们只能自己和供应商一起把上面提到的这些硬件、软件、算法的东西都解决好才行。我们大概2022年开始启动,到今天,终于解决的比较好了。最终的成品,平均PPD40,中心区域超过45,应该说是行业领先了。
MR 也是重要的技术挑战。
传统的 VR 无法看到现实,更无法做到融合。MR(Mixed Reality)代表了新一代的技术:能够看到现实,并且能够把虚拟的物体与现实世界融合。但这也带来巨大的技术挑战。
比如 SLAM 技术,核心是让头显精准感知用户的位置与姿态角度;而为实现运动补偿,还需进一步估算运动速度。同时,微显示屏上的高清图像,通过光学镜头后,会有畸变,比如边缘被拉伸、中心被放大,所以要做逆畸变处理。从源头到输出,整个过程的计算量非常大,而且都是对高清、高帧率的视频做实时的处理,又需要特别低的延迟。在有限的功耗空间里,这个问题就特别困难。
如果这方面做得不好,就会让人产生眩晕感。如何低延迟、高精度的完成这个计算,就是核心问题。这里面,就需要有强大且低功耗的算力,需要专用的芯片才能够做到。
于是,2022年6月我们正式立项,全链路自研了一颗头显专用的消费电子芯片来解决这个处理瓶颈。芯片在2024年回片,目前进入量产阶段,各项指标均达到设计要求。
目前在实测中,我们的系统延迟可以做到12毫秒左右,这是非常不容易的。即便是世界顶尖的公司,用软件来做的话,也很难在不明显牺牲画质的前提下把延迟压到25毫秒以内。
![]()
图源企业
交互的挑战也非常重要。我们如果希望做虚实融合,那需要对现实环境做识别。我们需要非常高精度的ground truth进行校准与训练。为此,我们建设了专业的高精度测试系统。
新的MR设备交互,需要eye tracking,hand tracking,这些也都需要高精度的ground truth。只有搜集到较广泛的数据,才有机会让体验在更广泛的人群上保持鲁棒的高体验。所以我们也做了专门的3D重建机制与高精度手势数据采集系统。
XR的路还很长,挑战也很多。上面只是举了一些技术的例子。26年我们就会有新的产品发布,期望未来我们通过持续的技术研发,能够给大家带来体验更好的产品。
2023,大模型的时代
2022 年11 月30 日,ChatGPT横空出世,2023年引起广泛关注。我们在2021年,有过一次机会早点关注到。
当时我们一个同事,也训练了一个大语言模型,但我们不知道干什么用。我们想,是否可以用来改进搜索?于是把这个pretrain的LLM,在搜索的relevance任务上去fine tune。结果和bert模型做对比。提升幅度很小,计算cost又增加很多。于是得到一个结论,这个LLM目前没什么用。所以还是很没眼光。
不过公司调整的很快,在2022年,我们在这个方向上开始投入。现在,我们也取得了一些成果。应用上大家可能更熟悉一些,豆包是中国最流行的AI对话助手,火山引擎的大模型服务也受到客户的认可,根据IDC的报告,火山是中国MaaS市场的第一名。
技术上我们也有自己的特点。得益之前的一些积累,我们在Infra方面做的还是比较好的。我们很早就建设了大规模的稳定训练系统MegaSacle,在训练任务上,MFU(浮点运算利用率)超过55% ,这是当时主流开源框架的1.3倍以上,效果还是很不错的,有兴趣的可以去看我们24年年初发的相关论文。
我们在模型结构、自研服务器上也有很多探索,这也让我们实现了大模型的低调用成本。所以,我们在通过火山引擎提供服务的时候,才能够打破业界价格下限,同时保证自己有不错的毛利。
我们的GenMedia模型、VLM、语音模型表现很好,长期属于国际一流水平。另外,在大模型的研究方面还有一些更前沿的探索,我们叫Seed Edge计划。我不展开讲了。
对未来大模型如何发展,我也不知道,但是我可以提几个小问题,和大家一起讨论。
大家都在谈论AGI,但什么是AGI,应该如何评估是否到达AGI了?
大家都有不同的看法,我说��我的。我们可以做一个思想实验。假设把全世界的人类的工作(包括最初级的工作,也包括最顶尖科学家的工作)全部拿出来,让AI去做。我们定一个比例,比如95%,如果95%的工作AI全部都能完成,我们可能就可以说真的达到AGI了。
AI的能力发展是非常不均衡的,今天大模型可以在国际数学奥林匹克上拿到金牌,这恐怕已经超过了99.9%的人类。但对于很多工作,比如,一个初中生可以胜任的电话客服工作,大模型目前还不能完全做好。
那我们从补短板的角度继续去思考一下,为什么会这样?一个比较直观的,是模型的学习能力。
目前的大模型是分阶段的,训练阶段和推理阶段。当模型部署到线上开始服务,就不再被训练,或者说,只能做in context learning。这和人类是不一样的。人类是持续在学习的。
比如电话客服,一个名校的博士可能刚开始也不知道怎么做好,但人可以很快学习,可能用不了几天就可以把工作做好了。而且人的学习效率很高,并且充分利用社会环境,比如他可以问一下老员工或者经理该怎么做。
所以说,如何让大模型提高学习能力,是一个比较重要的问题。最好是每一个人都可以以他的方式教知识给大模型。
第二个能力是IO能力,也就是和这个世界交互的能力。这个也显而易见。即便在数字世界,虽然目前的大模型,在视频、图片合成方面的能力已经超过人类,但是在众多内容理解、界面操作等方面,模型还是和人有比较大的距离。
这些都是非常基础,但非常值得研究的问题。
有人说,2023年是人类历史上的第3个奇迹年,我觉得丝毫不为过。AI的发展给人类社会预期会带来巨大的变革,这场变革里会有无数的问题,需要技术人去探索,去解决。
字节跳动也会在大模型等前沿领域,持续耐心的探索下去,希望能够为人类社会贡献自己的力量。