美团 LongCat 团队发布全模态一站式评测基准 UNO-Bench 美团技术团队 作者 美团技术团队 美团技术团队 2025年11月17日 08:00 美团 LongCat 团队提出了一套高质量、多样化的一站式全模态大模型评测基准——UNO-Bench。该基准通过一个统一的框架,不仅能同时精准衡量模型的单模态与全模态理解能力,更首次验证了全模态大模型的“组合定律”——该定律在能力较弱的模型上呈现为短板效应,而在能力较强的模型上则涌现出协同增益,为行业提供了一种全新的、跨越模型规模的分析范式。
美团开源LongCat-Audio-Codec,高效语音编解码器助力实时交互落地 美团技术团队 作者 美团技术团队 美团技术团队 2025年11月14日 08:00 针对 Speech LLM 落地中的音频处理难题,美团 LongCat 团队正式开源专用语音编解码方案 LongCat-Audio-Codec。它提供了一套一站式的 Token 生成器(Tokenizer)与 Token 还原器(DeTokenizer)工具链,其核心功能是将原始音频信号映射为语义与声学并行的 Token 序列,实现高效离散化,再通过解码模块重构高质量音频,为 Speech LLM 提供从信号输入到输出的全链路音频处理支持。真正让语音大模型既 “听懂” 语义,又能够“说清” 。
美团 LongCat 团队发布 VitaBench:基于复杂生活场景的交互式 Agent 评测基准 美团技术团队 作者 美团技术团队 美团技术团队 2025年11月2日 08:00 美团 LongCat 团队研发的 VitaBench(Versatile Interactive Tasks Benchmark)正式发布,这是当前高度贴近真实生活场景所面临复杂问题的大模型智能体评测基准。VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体,构建了包含 66 个工具的交互式评测环境,并进行了跨场景的综合任务设计,例如要求 agent 在一个旅行规划任务中通过思考、调用工具和用户交互,完整执行到买好票、订好餐厅的终端状态。
LongCat-Flash-Omni正式发布并开源:开启全模态实时交互时代 美团技术团队 作者 美团技术团队 美团技术团队 2025年11月3日 08:00 美团 LongCat-Flash 系列再升级,美团正式发布全新家族成员 LongCat-Flash-Omni,在文本、图像、视频理解及语音感知与生成等关键单模态任务中,均展现出极强的竞争力。LongCat-Flash-Omni 是业界首个实现 “全模态覆盖、端到端架构、大参数量高效推理” 于一体的开源大语言模型。
ICCV 2025 | 美团论文精选及多模态推理竞赛冠军方法分享 美团技术团队 作者 美团技术团队 美团技术团队 2025年10月27日 08:00 本文介绍了美团技术团队在国际顶会 ICCV 2025 中发表的 5 篇论文。同时,在ICCV 2025 举办的多模态推理竞赛中,美团基础研发平台/计算和智能平台组建的 ActiveAlphaAgent 团队,斩获赛题 1 真实场景视觉定位(VG-RS)冠军,赛题 2 空间感知视觉问答(VQA-SA)季军和赛题 3 创意广告视频视觉推理(VR-Ads)季军。本文也分享了这三道赛题的解题思路,希望相关研究能给同学们带来一些帮助或启发。
LongCat-Video 视频生成模型正式发布,探索世界模型的第一步 美团技术团队 作者 美团技术团队 美团技术团队 2025年10月27日 08:00 美团 LongCat 团队正式发布 LongCat-Video 视频生成模型 —— 不仅以统一模型在文生、图生视频基础任务上达到开源最先进水平,更依托原生视频续写任务预训练,实现分钟级长视频连贯生成,从根源上保障跨帧时序一致性与物理运动合理性,尤其在长视频生成领域具备显著优势。
从0到1建设美团数据库容量评估系统 美团技术团队 作者 美团技术团队 美团技术团队 2025年10月17日 08:00 美团数据库团队推出了数据库容量评估系统,旨在解决数据库容量评估与变更风险防控等领域难题。本文介绍了系统架构和主要功能:系统使用线上流量在沙盒环境回放验证变更安全,结合倍速回放技术探测集群性能瓶颈,构建容量运营体系实现集群容量观测与治理闭环。系统具备数据操作安全、结果真实可靠、灵活高效赋能等特点,有效提升数据库稳定性与资源利用率。
可验证过程奖励在提升大模型推理效率中的探索与实践 美团技术团队 作者 美团技术团队 美团技术团队 2025年10月10日 08:00 美团业务研发搜推平台部算法团队创新提出可验证过程奖励机制(VSRM),针对大模型推理中的冗余回复与过度思考问题,精准奖励有效推理步骤,显著缩减输出长度并提升推理效率。VSRM 通过步骤级正确率增益评估,有效抑制无效步骤,兼容主流强化学习算法,助力高效、可靠的复杂推理任务。
开源 | InfiniteTalk:无限长虚拟人视频生成的新范式 美团技术团队 作者 美团技术团队 美团技术团队 2025年9月21日 08:00 为解决虚拟人长视频生成的质量退化问题,美团基础研发平台/视觉智能团队推出了 InfiniteTalk 技术,实现无限时长视频生成。已在 GitHub 开源并获 1.6K Stars,Hugging Face 月下载量 64.8K,受到了很多好评,能够应用到电商直播、教育、影视等领域。
LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速! 美团技术团队 作者 美团技术团队 美团技术团队 2025年9月22日 08:00 美团 LongCat 团队正式发布全新高效推理模型 LongCat-Flash-Thinking。综合评估显示,LongCat-Flash-Thinking 在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的最先进水平(SOTA)。
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型 美团技术团队 作者 美团技术团队 美团技术团队 2025年9月11日 08:00 SGLang 团队是业界专注于大模型推理系统优化的技术团队,提供并维护大模型推理的开源框架SGLang。近期,美团M17团队与SGLang团队一起合作,共同实现了LongCat-Flash模型在SGLang上的优化。