普通视图

发现新文章,点击刷新页面。
昨天以前首页

【开发AGIC】Vue3+NestJS+DeepSeek AI作业批改系统(已开源)

作者 管一诺
2025年10月8日 12:29

前言

大家好,我是一诺。国庆假期带儿子回老家带了几天,鬼天气忽冷忽热的 我和儿子都给整生病了。

也没有出去玩,除了在家带娃,空闲时间开源了能豆ai批改助手

说下产品背景

我有个朋友是英语老师,常熬夜批改作文。平时在用 DeepSeek 批改作业,可没办法批量修改,很特别麻烦。就希望能有个可以统一管理作业,沉淀教学数据的工具。

于是就有了"能豆AI"这个产品,集成DeepSeek分析能力,实现了学生在线提交作业 → AI实时批改 → 教师人工核实批改的完整业务闭环。

核心功能-ai批改作业

ca3c8ae8-2f25-48af-a05a-f7db06a437c1.gif

为什么叫能豆AI。

我在设计 logo ,不知道叫什么好。这时我儿子在扶着墙学走路,他刚9个月刚会爬就想尝试走~ ,那就叫"能豆AI"吧,因为我儿子的小名叫豆豆。

在线预览

在线体验 ai.dslcv.com/

仓库地址

  1. github ➡️ github.com/yinuoguan/n…
  2. gitee ➡️ gitee.com/wang-tians-…
  3. 接口文档 http://124.222.166.174:3002/api/docs

架构图

总体架构图

业务流程

技术选型

前端技术栈

选择 Vue 3 + TypeScript 作为前端框架,之前一诺维护的老项目都是vue2, 这次全面使用Vue3开发,发现用 Composition API 写起来更灵活,特别是处理复杂的业务逻辑时。

Vuex 用来管理全局状态,比如用户登录信息。局部状态还是放在组件里,这样代码更清晰。

Element Plus 是因为组件比较全面。配合 Tailwind CSS 做一些个性化的样式调整,开发速度很快。

后端技术栈

后端用的是 NestJS,说实话一开始也考虑过 Express,但 NestJS 的装饰器和模块化设计确实香,代码组织得很清晰。

JWT 做身份认证,无状态的,扩展性好。Swagger 自动生成 API 文档。

数据存储

MongoDB 选择的原因很简单:作业数据结构比较灵活,不同类型的作业字段差异很大,用文档数据库比关系型数据库方便多了。而且 MongoDB 的查询也够用,性能也不错。

Redis 主要用来缓存一些热点数据和存储用户会话,毕竟内存数据库速度快,用户体验好。

AI大模型

DeepSeek 是主力,性价比真的很高,批改质量也不错。关键是 API 调用稳定,价格也能接受。

后来又集成了豆包,主要是想让 AI 的反馈更温馨一点,豆包在情感表达这块做得比较好,学生看到反馈不会那么有压力。

两个模型配合使用,DeepSeek 负责专业的内容分析,豆包负责鼓励和引导,效果比单用一个模型好很多。

核心模块

1.班级管理

这是系统的基础模块,解决了教师管理多个班级的痛点:

核心功能:

  • ✅ 创建班级:支持自定义班级名称、描述和邀请码
  • ✅ 学生管理:通过邀请码机制,学生可以自主加入班级
  • ✅ 状态管理:可以暂停/激活学生,灵活管理班级人员
  • ✅ 实时统计:学生数量和作业完成情况一目了然

2. 作业提交与批改模块

状态流转管理:

核心特性:

  • 学生端:专用提交和查看功能,界面简洁易用
  • 教师端:批改和统计管理功能,支持批量操作
  • 管理员端:AI批改和日志管理,系统监控

3. AI 批改集成

这是系统的技术亮点,与 DeepSeek 的深度集成:

AI批改能力:

mindmap
    root((AI批改))
        DeepSeek
            语法检查
            逻辑分析
            内容评估
        豆包
            情感识别
            温馨反馈
            学习引导
        评分
            多维度评价
            个性化建议
            数据洞察

AI批改流程:

image.png

批改质量保障:

  • 多轮提示词优化,确保批改一致性
  • 人工复核机制,AI + 人工双重保障
  • 批改日志记录,便于分析和改进
  • 异步处理机制,不阻塞用户操作

4. 权限管理系统

graph TB
    A[超级管理员] --> B[系统配置]
    A --> C[用户管理]
    A --> D[数据监控]
    
    E[教师] --> F[班级管理]
    E --> G[作业发布]
    E --> H[批改审核]
    
    I[学生] --> J[加入班级]
    I --> K[提交作业]
    I --> L[查看成绩]

功能展示

管理员端功能

主要功能:

  • 系统配置管理:AI模型参数调整,批改规则配置
  • 用户权限管理:教师和学生账号管理,权限分配
  • 数据统计分析:批改效率统计,系统使用情况分析
  • 批改日志查看:AI批改过程追踪,质量监控

控制台看板

大模型配置 && 用户管理

教师端功能

主要功能:

  • 班级创建与管理:一键创建班级,邀请码分享
  • 作业发布与管理:灵活的作业类型,截止时间设置
  • 批改结果查看:AI初评结果查看,人工复核操作
  • 学生成绩统计:班级整体表现分析,个人进步追踪

工作台

创建班级

添加学生

发布作业

配置AI批改规则

作业详情

批改作业

学生端功能

主要功能:

  • 班级加入:通过邀请码快速加入班级
  • 作业提交:支持草稿保存,多次修改提交
  • 批改结果查看:详细的AI评语和教师点评
  • 学习进度追踪:个人作业历史,成绩变化趋势

激活账户

学习中心

班级作业

提交作业

查看结果

AI点评和老师批注

Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI 诞生

作者 莫崇宇
2025年9月30日 08:16

论卷编程,还得看 Claude。

就在刚刚,Anthropic 正式发布 Claude Sonnet 4.5。

先说 Claude Sonnet 4.5 交出的成绩单,在考察真实编程水平的 SWE-bench Verified 测试里,Claude Sonnet 4.5 直接登顶业界第一。

更离谱的是,它能连续专注干活超过 30 小时。

好好好,AI 取代人类的优势又 +1 了。

比如让它写个类似 Slack 或 Teams 的聊天应用,它能一口气敲出大约 1.1 万行代码。相比之下,之前的 Claude Opus 4 和 Codex,最多也就能独立工作七小时。

用 Anthropic 的话来说,Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学,各项能力都狠狠提升了一波。

比方说,在 OSWorld 这个专门测试真实计算机任务的基准里,它拿下了 61.4% 的成绩,直接第一。要知道,四个月前 Sonnet 4 还以 42.2% 的成绩遥遥领先,这才多久性能就又往上抬了一大截。

而 Anthropic 的 Claude Chrome 插件甚至能直接在浏览器里自己导航网站、填表格、处理任务,像个真人在操作似的。推理、金融这些测评项目上也都更强了,各项指标都在往上涨。

有了这么强的能力,Anthropic 这次自然不会只发个模型就完事。

具体来看:

  • Claude Code加了「检查点」功能,能随时保存进度,想回退到之前某个状态一键搞定
  • 终端界面翻新,还发布了原生 VS Code 插件
  • Claude API 增加了上下文编辑功能和记忆工具
  • 代码执行和文件创建现在直接整合到对话里

甚至,Anthropic 把自己内部用来搭建 Claude Code 的底层基础设施也开放出来了,叫 Claude Agent SDK。

智能体怎么在长时间任务里管理记忆、怎么设计权限系统让自主性和用户控制找到平衡点、怎么让多个子智能体配合着完成目标,这些都是构建和设计 AI 智能体的棘手问题。

而借助 Claude Agent SDK,现在你也能拿去构建自己的产品。

今天起,开发者还可以通过 Claude API 调用 claude-sonnet-4-5。定价还是跟 Claude Sonnet 4 一样,每百万 tokens $3/$15,价格没变能力更强。

网友 @vasumanmoza 体验完直接发帖:

「Claude 4.5 Sonnet 刚在一次调用里重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个全新文件。它把所有东西都模块化了,拆掉了巨石式结构,清理了意大利面条式代码。结果完全跑不通,但天啊真的很优雅。」这评价,属于又爱又恨那种。

Cursor 表示,在 Claude Sonnet 4.5 上看到了最前沿的编程性能,尤其处理长周期任务时提升明显。这也再次说明为什么很多 Cursor 用户会选 Claude 来解决最复杂的问题。

知名测评博主 Dan Shipper 则表示,新版 Sonnet 4.5 在使用体验上响应速度更快,可控性更强,也更稳定。

性能强是一方面,安全性也得跟上。

据介绍,Claude Sonnet 4.5 也是 Anthropic 到目前为止对齐度最高的前沿模型。

靠着 Claude 更强的能力加上完善的安全训练,Anthropic 在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,Anthropic 在防御提示注入攻击和减少内容误判这块也有了重大突破。

比较让我感兴趣的是,Anthropic 还在 Claude Sonnet 4.5 发布的同时推出了个临时研究预览功能,叫「Imagine with Claude」。

在这个功能里,Claude 会实时生成软件,所有功能不是预设的,所有代码也不是提前写好的。你看到的一切都是 Claude 跟你互动时当场创造和调整出来的。

不过,「Imagine with Claude」接下来五天内只会对 Max 订阅用户开放。

附上传送门 claude.ai/imagine。

毫无疑问,今年的 AI 赛道依旧是卷编程的一年。

目前 Anthropic 估值已经到了 1830 亿美元,8 月还实现了年化营收 50 亿美元,但这其中相当一部分增长靠着来自编程软件的普及。问题是,老对手 OpenAI 和 Google Gemini 也在疯狂推类似工具抢程序员用户。

甚至一周之后就是 OpenAI 年度开发者大会,Anthropic 这个时候抢先发布 Claude Sonnet 4.5,时间卡得够精准,明摆着就是要给对手上一波压力。

此外,Anthropic 联合创始人兼首席科学官 Jared Kaplan 还表示,更先进的 Opus 模型,预计今年晚些时候推出:「Anthropic 在大小模型的使用上都能占优势。」

不过有一说一,Anthropic 自己眼下也有麻烦要解决。

过去两个月,Claude 系列模型刚经历了一场「降智」风波。用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑,连付费的 Max 用户都没能幸免。

虽然 Anthropic 后来紧急回滚了 Opus 4.1 更新,还承认了两个独立 Bug,声明「绝非为省成本故意降智」,但由于没提供补偿或退款,GitHub 和 X 等平台上还是出现了退订潮,不少用户直接转投 Codex。

这次 Claude Sonnet 4.5 的发布,显然就是 Anthropic 想用实打实的性能提升来挽回流失的用户。至于能不能成功,就看接下来几周的实际表现了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌