普通视图

发现新文章,点击刷新页面。
昨天以前美团技术团队

美团开源OIBench与CoreCodeBench:揭示大模型编程能力的真实水平

Meituan-M17 团队联合上海交大等机构,分别推出了 OIBench(聚焦高区分度算法题评测)与 CoreCodeBench(聚焦多场景工程级代码基准)两大数据集,旨在揭示大模型编程能力真实水平,这两大数据集已分别在GitHub和Huggingface上进行开源。
❌
❌