普通视图
德国5月工业新订单环比下降1.4%
领克10 EM-P全球首秀
韩国电线电缆制造商LS Cable&System获得新加坡1477亿韩元高压电缆合同
中国通号卡斯柯正式签约迪拜蓝线项目
阿尔斯通获得纽约大都会运输署价值20亿欧元订单
上交所召开落实科创板“1+6”政策股权投资机构座谈会
越南第二季度GDP同比增长7.96%
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究
DeepSeek R1横空出世第128天,已经把整个大模型市场搅得天翻地覆!
首先,它以一己之力把推理模型的价格打下来,OpenAI六月更新的o3价格相比o1直接打了2折。
其次,第三方平台托管的DeepSeek模型使用量疯狂增长,比刚发布时涨了将近20倍,成就了大批云计算厂商。
然而,DeepSeek自家的网站和API市场份额却不断下降,跟不上AI产品上半年持续增长的节奏了。
以上数据来自SemiAnalysis发布的一篇报告,详尽解读了DeepSeek对AI模型竞赛的影响以及AI市场份额的现状。
揭开DeepSeek的降本秘诀
DeepSeek刚发布时确实火得一塌糊涂,但四个多月过去了,情况却有点微妙。
从数据来看,DeepSeek自家网站和API的流量不升反降,市场份额也在持续下滑。
到了5月,全网DeepSeek模型产生的token中,来自DeepSeek本家的份额已经只占16%了。
网页版聊天机器人流量也大幅下降,而同期其他主要大模型网页版流量都在飙升。
DeepSeek V3与R1模型都经过版本更新,能力与1月相比更强了,价格又便宜,怎么用户反而跑了呢?
这种“墙内开花墙外香”的现象,背后其实大有文章。
SemiAnalysis指出,DeepSeek为了把成本压到极致,在服务质量上还是做了大量妥协。
用户在DeepSeek官方平台上使用模型,经常要等上好几秒才能看到第一个字蹦出来,可以用首token延迟(First token latency)这个指标来衡量。
相比之下,其他平台虽然普遍价格更贵,但响应速度快得多,有些甚至能做到几乎零延迟。
在Parasail或Friendli等平台,只需支付3-4美元就可以获得几乎没有延迟的100万token额度。
如果想选择更大更稳定的服务商,微软Azure平台价格是DeepSeek官方的2.5倍,但延迟减少了整整25秒。
从另一个角度看,DeepSeek官方甚至不是同等延迟下价格最低的一家DeepSeek模型服务商。
如果在这张图上用气泡大小表示上下文窗口,可以看出DeepSeek在价格与性能之间的另一个权衡。
在有限的推理计算资源下,只提供64k上下文窗口的服务,在主流模型提供商中算是最小的之一。
在需要读取整个代码库的编程场景里,64K根本不够用,用户只能选择第三方平台。
而同样价格下,Lambda和Nebius等平台能提供2.5倍以上的上下文窗口。
DeepSeek还把很多用户的请求打包在一起处理,虽然每个token的成本降下来了,但每个用户等待的时间也增加了。
大模型下半场:提升每个token的智能
需要明确的是,这些降本策略都是DeepSeek主动做出的决定。
他们目前看上去对用户体验不怎么感兴趣,既无意从用户身上赚钱,也无意通过聊天应用或API服务向用户提供大量token,更多地是专注于实现AGI。
从这些优化策略就可以看出,DeepSeek把尽可能少的算力用作推理服务给外部使用,大量的算力资源留在内部研发用途。
同时配合开源策略,让其他云服务托管他们的模型,赢得影响力和培养生态,两不耽误。
说到底,AI竞赛拼的还是算力资源。
在DeepSeek影响下,Claude也开始降低速度缓解算力紧张的问题,但为了营收还是在努力平衡用户体验。
Claude 4 Sonnet发布以来,输出速度已经下降了40%,但仍然比DeepSeek快不少。
另外Claude模型被设计成生成更简洁的回复,回答同样的问题,DeepSeek和Gemini可能要多花3倍的token。
种种迹象表明,大模型供应商正在多维度地改进模型。
不仅仅是提高模型的智能上限,而是提升每个token能提供的智能。
参考链接:[1]https://semianalysis.com/2025/07/03/deepseek-debrief-128-days-later/#speed-can-be-compensated-for
本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。
受电动汽车需求影响,特斯拉6月份在英国销量同比增长14%
上海乐高乐园今日开园,未来5-10年新规划已在定制
6月大宗商品价格指数环比上涨0.5%
保险股走出牛市节奏,下半年重在资产负债匹配
招商签约超400亿元,发布5大人工智能应用场景,宜宾市京津冀投资推介活动顺利举办
7月4日,以“数链首都 宜启未来”为主题的宜宾市2025京津冀投资推介活动在北京举行。活动期间共签约项目122个,签约总金额达403.08亿元,涵盖基金机构、数字经济、新型储能、动力电池、智能网联新能源汽车、低空经济等领域,主要包括鼎晖投资、弘毅投资、大连金慧、同方科技、追觅生态链企业等。
当前,全球科技变革加速推进,人工智能、大数据、云计算等前沿技术是驱动未来科技发展的重要方向。发展数字经济,关键在于加强前沿技术领域创新能力,并加速实现从基础研究到产业应用的深度转化。
宜宾市主要负责人在致辞中表示,宜宾将深度进军数字经济新赛道,不断展望向数而变的未来场景。在数字风潮引领下,全力抢滩数字新蓝海,目前数字经济产业规模已突破 600 亿元,未来几年将突破千亿大关,与优质白酒、动力电池、晶硅光伏共同构筑起四大千亿产业集群,正加速形成富有宜宾特色和优势的现代化产业体系。同时,将快速拓展数字能源、智能网联新能源汽车、通用人工智能相关产业等未来产业新赛道,加快启动联动实验室、具身智能创新中心多场景深度应用,以产业焕新之势促进城市攀高向强。
宜宾市2025京津冀投资推介活动现场
人工智能产业建设方面,同期举办的人工智能城市深度应用场景发布会上,发布了宜宾市2025年人工智能城市深度应用场景机会清单、宜宾具身智能机器人训练中心计划、AI赋能行业高质量发展行动计划、AI联合实验室合作计划。
值得关注的是,人工智能城市深度应用场景机会清单,针对“人工智能+工业制造”“人工智能+医疗健康”“人工智能+教育教学”“人工智能+城市治理”“人工智能+政务服务”5大领域,推出协作工业机器人、智慧医院信息化建设、智慧教室建设、城市智能机器人、“高效处置一件事”AI应用等14类应用场景,预计总投资13.3亿元。宜宾希望通过深度应用场景的落地,释放人工智能技术价值,进一步赋能企业降本增效、提升医疗服务水平、提升全市校园科技教育水平、人工智能与城市治理深度融合、提升政务服务水平。
宜宾市2025年人工智能城市深度应用场景机会清单节选
宜宾具身智能机器人训练中心由宜宾市高铁南片区、北京银河通用机器人有限公司、宜宾发展产城投资有限公司三方联合打造,是银河通用在白酒行业布局的全国主要训练基地。
“机器人行业发展需要数据、场景、政策支持,尤其需要开放场景、鼓励企业先试先用。西南市场潜力巨大,银河通用落地宜宾具身智能机器人训练中心,能够加速我们从技术落地、模型数据、产业链布局等整体的发展,和产业携手往前走。”北京银河通用机器人有限公司副总裁闻爱荣表示,深度的垂直应用场景的开放将推动行业进一步发展。
银河通用具身大模型机器人Galbot G1作为本次投资推介会联合主持人登场
此外,在宜宾市“江源行动”第二批榜单发布会上,发布了固态电池电芯、人工智能、智能物联与数据融合等 14 个方向榜单;在数字能源产业生态共创交流会上,各位专家学者、业界精英围绕 AI 赋能能源转型、储能智慧运营和钙钛矿技术等进行深入研讨;在资本招商联盟合伙人招募会上,发出了宜宾市资本招商合伙人招募令。
四场专题会,从场景、技术、产业、资本等各方面,传达出宜宾发展数字经济新的决心。宜宾市经济合作和新兴产业局相关负责人介绍,去年在京签约的48个项目也在宜宾结出累累硕果,产业关系由“传统承接”转向“技术共研、资本共投、场景共建”。宜宾也借助京津冀这个重要通道和前沿窗口,与国际深度接轨,更加融通四海、“链”接天下。
接下来,宜宾也将深化此次推介会成果转化,深度进军数字经济新赛道,不断展望向数而变的未来场景。
今年前五个月全国农村公路固定资产投资超1300亿元
AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿、已服务超50万用户|硬氪首发
作者|黄楠
编辑|彭孝秋
硬氪获悉,AIGC独角兽南京硅基智能科技集团股份有限公司(以下简称“硅基智能”)近日完成数亿元D轮融资,投资方为嘉兴高新区产业基金(嘉兴秀洲区)。本轮资金将重点用于研发创新投入、推动技术落地并加快产品的市场化应用。
自2017年成立以来,「硅基智能」已完成超十亿元、10轮融资,其背后投资方包括腾讯、红杉中国、招银国际、中财奇虎、海松资本等。公司聚焦AIGC数字人技术研发与商业化应用,提出以硅基劳动力为核心,构建了DUIX智能交互平台、虚拟直播平台、视频生产平台和智能客服四大产品线。
随着AI大模型、计算机视觉、语音合成等技术的迅猛发展,数字人产业在中国迅速崛起,其通过AI技术生成的虚拟形象,能模拟人类的外貌、声音、表情并具有交互能力,被广泛应用于直播、客服、教育、娱乐等领域。
根据艾瑞咨询报告显示,2023年中国数字人市场规模已突破100亿元,预计2025年达到300亿元,年复合增长率超过50%。
当前市场上涌现了大量的AI Agent,随着大模型推理成本持续下降,单纯提供逻辑和流程自动化的能力,其技术门槛和商业壁垒将迅速消解。“纯工具性的Agent,最后一定会陷入惨烈的价格战。”「硅基智能」创始人司马华鹏告诉硬氪。
硅基智能创始人司马华鹏出席2024年36氪WISE商业之王大会
司马华鹏指出,许多行业的智能化水平仍停留在初级阶段,事实上人们对高质量Agent存在广泛需求。AI天然具备基于逻辑推理的思维链能力,能够以绝对理性的方式解决问题,在此基础上所衍生的数字人智能体也开始进入更多需要深度推理的场景。
“比如医生对疾病的推断,本质上就是依据证据链、患者特征等信息,运用专业知识进行思维链推导的过程。”司马华鹏说,“各行各业中存在大量的思维链应用节点,未来这些节点可能逐步由AI接管,形成‘人机协同’的工作模式,即AI凭借思维链逻辑处理标准化环节,人类则聚焦创意决策、情感交互等更核心的领域。”
算法技术平台是「硅基智能」数字人产品体系的底层支撑。2024年11月,「硅基智能」以API形式,推出新一代多模态大模型DUIX ONE,该模型集成了语音识别、语音合成、NLP和计算机视觉等核心算法能力,可以提供看、听、说、高情商、并具有人类实时形象等多模态能力。
其优势在于极大提升了交互的真实感,有效解决过去传统数字人“形似神不似”的问题。同时,进入落地市场化阶段也具有更强的普适性和应用潜力。
硅基智能DUIX ONE多模态大模型
在语音技术方面,DUIX ONE能够精准识别不同口音、语速的语音内容,在嘈杂环境下保证稳定运行,准确率高、抗噪能力强;随后可生成自然流畅、富有情感的人声,实现逼近真人发声效果。
在数字人形象构建方面,「硅基智能」通过完整人脸建模技术,能够快速、精准地创建高度逼真的人脸模型;虚拟形象驱动算法基于语音、文本等输入,可实时驱动数字人的面部表情、肢体动作,保证其行动的生动性与自然度。
进入交互环境,DUIX ONE能够深入理解人类语言背后的语义与情感,并提供智能对话、文本分类、知识问答等功能。期间,数字人会根据对话场景与用户需求,生成逻辑严谨、内容丰富的回复。
商业化方面,「硅基智能」采用差异化产品策略,针对企业客户和个人用户提供定制化服务方案。面向企业市场(2B领域),公司重点服务运营商、电商平台、传媒机构等客户群体,通过标准化的API接口服务,实现AI能力的模块化输出,大幅降低企业的技术应用门槛。
以电商直播场景为例,企业客户提供5分钟左右的视频素材,即可在AI训练平台快速完成数字人主播的个性化定制。平台支持形象外观、声音、语言风格等全维度特征建模,高度还原真人主播特质。生成后的数字人主播还具有实时智能交互能力,能准确理解观众提问,并根据评论内容作出回应,增强直播间互动性、提高观众留存率。
硅基数字人在各行业中落地应用
目前,「硅基智能」数字人业务营收已达数亿规模,为5000余家合作品牌提供数字人主播解决方案,帮助商家降低约80%成本;在金融行业,已同超30家银行、保险公司合作并部署智能客服数字人;还与主流电视台合作开发虚拟主持人等。
面向C端用户,「硅基智能」推出了数字人“克隆”服务,帮助用户创建专属数字分身,并实现虚拟形象定制、智能陪伴等个性化功能。同时在DUIX智能交互平台和视频生产平台上,普通用户也能轻松完成"数字人视频生成"“数字人实时交互”等专业级创作,进一步降低数字内容创作的门槛。
硬氪了解到,「硅基智能」已将数字人克隆服务价格降至数千元,生产过程采用全自动化流程,仅需1秒视频,即可完成形象和声音克隆,在保证1个工作日快速交付的同时,也大幅降低了技术应用成本。
官方最新数据显示,「硅基智能」平台服务用户超过50万,日均用户生成内容突破50万条,累计AIGC直播时长在千万小时以上。通过数字人技术在短视频、直播等场景的深度应用,越来越多的普通用户正从被动的内容消费者,转变成为积极参与的内容创作者。
为了进一步推动AIGC技术普惠化,「硅基智能」将DUIX平台核心技术全面开源,目前已发布的DUIX-Mobile版本支持Android和iOS平台,为开发者提供极简集成方案,仅需调用三行核心代码,即可将数字人功能快速嵌入自有产品体系,缩短开发周期,以加快数字人在文娱、法律、金融、教育、医疗等更多行业的规模化落地。
当融合了AI多模态大模型能力、能够实时对话的数字人逐渐渗透到更多领域,进入人们生活,这不仅是技术的进步,更重新定义了情感传递的方式。"数字永生"有望从概念走向现实,当人类的情感与记忆通过数字人技术在跨越时空得以保存,这也为生命形态的拓展了全新的维度。