美团 LongCat 团队发布全模态一站式评测基准 UNO-Bench

作者美团技术团队美团技术团队

2025年11月17日 08:00

美团 LongCat 团队提出了一套高质量、多样化的一站式全模态大模型评测基准——UNO-Bench。该基准通过一个统一的框架，不仅能同时精准衡量模型的单模态与全模态理解能力，更首次验证了全模态大模型的“组合定律”——该定律在能力较弱的模型上呈现为短板效应，而在能力较强的模型上则涌现出协同增益，为行业提供了一种全新的、跨越模型规模的分析范式。

美团技术团队
美团开源LongCat-Audio-Codec，高效语音编解码器助力实时交互落地美团技术团队, 美团技术团队
2025年11月14日 08:00

美团开源LongCat-Audio-Codec，高效语音编解码器助力实时交互落地

美团技术团队

作者美团技术团队美团技术团队

2025年11月14日 08:00

针对 Speech LLM 落地中的音频处理难题，美团 LongCat 团队正式开源专用语音编解码方案 LongCat-Audio-Codec。它提供了一套一站式的 Token 生成器（Tokenizer）与 Token 还原器（DeTokenizer）工具链，其核心功能是将原始音频信号映射为语义与声学并行的 Token 序列，实现高效离散化，再通过解码模块重构高质量音频，为 Speech LLM 提供从信号输入到输出的全链路音频处理支持。真正让语音大模型既 “听懂” 语义，又能够“说清” 。

美团 LongCat 团队发布 VitaBench：基于复杂生活场景的交互式 Agent 评测基准

美团技术团队

作者美团技术团队美团技术团队

2025年11月2日 08:00

美团 LongCat 团队研发的 VitaBench（Versatile Interactive Tasks Benchmark）正式发布，这是当前高度贴近真实生活场景所面临复杂问题的大模型智能体评测基准。VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体，构建了包含 66 个工具的交互式评测环境，并进行了跨场景的综合任务设计，例如要求 agent 在一个旅行规划任务中通过思考、调用工具和用户交互，完整执行到买好票、订好餐厅的终端状态。

美团技术团队
LongCat-Flash-Omni正式发布并开源：开启全模态实时交互时代美团技术团队, 美团技术团队
2025年11月3日 08:00

LongCat-Flash-Omni正式发布并开源：开启全模态实时交互时代

美团技术团队

作者美团技术团队美团技术团队

2025年11月3日 08:00

美团 LongCat-Flash 系列再升级，美团正式发布全新家族成员 LongCat-Flash-Omni，在文本、图像、视频理解及语音感知与生成等关键单模态任务中，均展现出极强的竞争力。LongCat-Flash-Omni 是业界首个实现 “全模态覆盖、端到端架构、大参数量高效推理” 于一体的开源大语言模型。

美团技术团队
ICCV 2025 | 美团论文精选及多模态推理竞赛冠军方法分享美团技术团队, 美团技术团队
2025年10月27日 08:00

ICCV 2025 | 美团论文精选及多模态推理竞赛冠军方法分享

美团技术团队

作者美团技术团队美团技术团队

2025年10月27日 08:00

本文介绍了美团技术团队在国际顶会 ICCV 2025 中发表的 5 篇论文。同时，在ICCV 2025 举办的多模态推理竞赛中，美团基础研发平台/计算和智能平台组建的 ActiveAlphaAgent 团队，斩获赛题 1 真实场景视觉定位（VG-RS）冠军，赛题 2 空间感知视觉问答（VQA-SA）季军和赛题 3 创意广告视频视觉推理（VR-Ads）季军。本文也分享了这三道赛题的解题思路，希望相关研究能给同学们带来一些帮助或启发。

美团技术团队
LongCat-Video 视频生成模型正式发布，探索世界模型的第一步美团技术团队, 美团技术团队
2025年10月27日 08:00

LongCat-Video 视频生成模型正式发布，探索世界模型的第一步

美团技术团队

作者美团技术团队美团技术团队

2025年10月27日 08:00

美团 LongCat 团队正式发布 LongCat-Video 视频生成模型 —— 不仅以统一模型在文生、图生视频基础任务上达到开源最先进水平，更依托原生视频续写任务预训练，实现分钟级长视频连贯生成，从根源上保障跨帧时序一致性与物理运动合理性，尤其在长视频生成领域具备显著优势。

从0到1建设美团数据库容量评估系统

美团技术团队

作者美团技术团队美团技术团队

2025年10月17日 08:00

美团数据库团队推出了数据库容量评估系统，旨在解决数据库容量评估与变更风险防控等领域难题。本文介绍了系统架构和主要功能：系统使用线上流量在沙盒环境回放验证变更安全，结合倍速回放技术探测集群性能瓶颈，构建容量运营体系实现集群容量观测与治理闭环。系统具备数据操作安全、结果真实可靠、灵活高效赋能等特点，有效提升数据库稳定性与资源利用率。