普通视图

发现新文章,点击刷新页面。
昨天以前美团技术团队

可验证过程奖励在提升大模型推理效率中的探索与实践

美团业务研发搜推平台部算法团队创新提出可验证过程奖励机制(VSRM),针对大模型推理中的冗余回复与过度思考问题,精准奖励有效推理步骤,显著缩减输出长度并提升推理效率。VSRM 通过步骤级正确率增益评估,有效抑制无效步骤,兼容主流强化学习算法,助力高效、可靠的复杂推理任务。

开源 | InfiniteTalk:无限长虚拟人视频生成的新范式

为解决虚拟人长视频生成的质量退化问题,美团基础研发平台/视觉智能团队推出了 InfiniteTalk 技术,实现无限时长视频生成。已在 GitHub 开源并获 1.6K Stars,Hugging Face 月下载量 64.8K,受到了很多好评,能够应用到电商直播、教育、影视等领域。
❌
❌