DeepTutor:开源AI学习助手

DeepTutor是一款AI驱动的个性化学习助手,它将文档转化为带有真实代码示例的交互式辅导。

DeepTutor:开源AI学习助手

每个开发者都经历过这样一个时刻。

你正盯着一份PDF文件。也许是一篇研究论文。也许是一本教科书里某个被某些人奉为“基础”的章节。你的咖啡已经凉了。你已经把同一段话读了三遍。但不知为何,这些文字仍然难以理解。

你不需要更多信息。你需要有人坐在你旁边,说:“好了,我们慢点儿。这到底是什么意思?”

这就是 DeepTutor 试图弥合的情感鸿沟。说实话,它真的做到了。

多年来,我一直在文档、Stack Overflow、YouTube 讲解视频和 Notion 里那些不完整的笔记之间来回切换。不是因为我喜欢混乱,而是因为学习复杂的技术知识通常感觉支离破碎,彼此脱节,甚至孤独。

DeepTutor 就像是终于有人意识到了这个问题,并说:“是的,我们可以做得更好。”

让我解释一下我的意思。

1、DeepTutor 的本质(抛开炒作)

DeepTutor 的核心是一个人工智能驱动的个性化学习助手。但这个词已经被用滥了,几乎失去了意义,所以让我们回归现实。

DeepTutor 允许你上传自己的学习资料。教科书、研究论文、技术手册、你自己的笔记。然后,它将所有这些内容转化为一个交互式系统,您可以在其中提问、生成练习、可视化概念,甚至模拟考试。

不是通用的 AI 答案,而是基于您的文档的答案。

这种区别比人们意识到的更重要。

2、真正的强大之处:海量文档问答,绝非枯燥乏味

大多数“与 PDF 对话”的工具都还不错……直到它们不再好用为止。它们会进行概括,会进行释义,如果过度使用,它们甚至会做出一些莫名其妙的解释。

DeepTutor 采用了一种更加严谨的方法。

2.1 智能知识库

您可以上传文档并构建特定领域的知识库。一旦完成索引,您就可以提出深入、精准的问题,并获得真正引用原始资料的答案。

而且答案并非含糊不清,而是结构清晰、引用完整、上下文准确。

区别在于:

“这是我在网上找到的一个概括性解释”

“这是你的教科书一步一步的解释”

2.2 多智能体问题求解

精彩之处就在这里。

DeepTutor 使用双循环推理架构。简单来说,这意味着它不会只是回答问题然后就结束。它会进行推理、检索、验证,甚至在需要时执行代码。

它结合了:

  • RAG(检索增强生成)
  • 网络搜索
  • 代码执行

所以,如果你问类似“为什么这个算法在边界情况下会失败?”的问题,它可以:

  • 从你的文档中提取相关理论
  • 与外部资源交叉验证
  • 运行示例代码来展示哪里出了问题

这不是聊天机器人。这是一个真正会检查自己作业的辅导老师。

2.3 学习并非线性过程,DeepTutor 深谙此道

大多数学习工具都忽略了一点:理解是一个复杂的过程。

你不会从困惑到清晰的直线过程。你会经历一个循环往复的过程。你需要比喻,你需要视觉辅助。有时,你只需要用不同的方式解释同一个概念。

2.4 交互式学习可视化

DeepTutor 致力于简化和可视化。

复杂的算法可以分解为:

  • 逐步讲解
  • 视觉辅助
  • 交互式演示

想象一下,有人一边在餐巾纸上画草图一边讲解概念。并不花哨,却非常有效。

而且,由于它会追踪学习过程,讲解内容会随之调整。如果你在理解某个概念时遇到困难,它不会每次都让你从头开始。它会记住你目前的进度。

仅凭这一点,它就比同类工具更人性化。

2.5 实践往往是学习失败的关键

阅读让人感觉高效。观看教程也让人感觉高效。但真正的学习发生在你尝试、失败、再尝试的过程中。

DeepTutor 不会把练习当作事后补救。

2.6 智能练习生成

根据您的知识水平,它可以生成:

  • 测验
  • 练习题
  • 定制评估

而且不是随机的,而是有针对性的。这种评估能够精准地找出您理解上的薄弱环节。

2.7 真实考试模拟

这部分让我很惊喜。

您可以上传真实的考试试卷或参考资料,DeepTutor 会生成与原题风格和难度相匹配的练习题。

同样的语气。同样的结构。同样的痛点。

如果您曾经走进考场时心想:“我复习过了,但没复习到这一部分”,您就知道这有多么重要了。

2.8 深度研究

研究通常是这样的:

  • 17 个浏览器标签页
  • 只读了一半的 PDF 文件
  • 永远不会再看的笔记

DeepTutor 试图将这种混乱压缩成易于管理的内容。

2.9 Litera事实审查与创意生成

它可以:

  • 分析多个来源
  • 识别跨学科模式
  • 将你通常不会联系在一起的想法联系起来

然后,它还能做到一件难得的事情:突出知识空白。

不仅仅是已知的知识,更是缺失的知识。以及哪些新的研究可能真正重要。

对于学生而言,这意味着清晰的思路。对于研究人员而言,这意味着强大的影响力。

3、架构

3.1 用户界面层

简洁明了的交互。你提问,它就回答。但输出结果并非一大段文字,而是结构化的、可操作的、易于理解的。

3.2 智能代理模块

不同的代理处理不同的任务:

  • 问题解决
  • 评估生成
  • 深度研究
  • 引导式学习
  • 创意开发

它是模块化的。这意味着你不会强迫一个模型去完成所有糟糕的任务。

3.3 工具集成层

这是它与现实世界连接的地方:

  • RAG 混合检索
  • 实时网络搜索
  • 学术数据库
  • Python 代码执行
  • PDF 解析

如果问题需要计算,它就进行计算。如果需要检索,它就进行检索。绝不弄虚作假。

3.4 知识与记忆基础

这是其默默支撑的基础:

  • 用于语义连接的知识图谱
  • 用于嵌入的向量存储
  • 用于保持对话连续性和引用的会话记忆

正是它让对话感觉连贯,而不是转瞬即逝。

4、入门指南

DeepTutor 不搞“注册后听天由命”的套路。它是开源的。您可以自行运行。

步骤 1:预配置

克隆仓库:

git clone https://github.com/HKUDS/DeepTutor.git
cd DeepTutor

设置环境变量:

cp .env.example .env
# Edit .env file with your API keys

可选配置:

  • 端口:config/main.yaml
  • LLM 设置:config/agents.yaml

如果您想快速体验,还可以尝试演示知识库。

步骤 2:安装选项

Docker(推荐)

如果您不想处理依赖项:

docker compose up-build-d
docker compose logs -f

其他实用命令:

docker compose up-d
docker compose down
docker compose up-build

独立构建:

docker build -t deeptutor: latest.
docker run -p 8001:8001 -p 3782:3782 \
--env-file .env deeptutor: latest
手动安装

用于开发或自定义:

conda create -n deeptutor python=3.10
conda activate deeptutor

或者:

python -m venv venv
source venv/bin/activate

安装依赖项:

bash scripts/install_all.sh

启动:

python scripts/start_web.py

或者仅使用命令行:

python scripts/start.py

访问点

数据存储

所有用户内容和系统数据都存储在 data/ 目录中:

data/
├── knowledge_bases/              # Knowledge base storage
└── user/                         # User activity data
    ├── solve/                    # Problem solving results and artifacts
    ├── question/                 # Generated questions
    ├── research/                 # Research reports and cache
    ├── co-writer/                # Interactive IdeaGen documents and audio files
    ├── notebook/                 # Notebook records and metadata
    ├── guide/                    # Guided learning sessions
    ├── logs/                     # System logs
    └── run_code_workspace/       # Code execution workspace

5、结束语

那么……这到底是为谁准备的呢?

说实话?任何厌倦了浅层学习的人。

  • 被 PDF 文件淹没的学生
  • 试图真正理解系统而不仅仅是复制代码的开发者
  • 整理复杂概念的研究人员
  • 想要获得反馈而不是噪音的自学者

它不是魔法。它不会一夜之间让难题变得简单。

但它能做到更有价值的事情。它会在你思考的过程中陪伴你。

也许只有我这么觉得,但这感觉才是学习的未来。不是用人工智能取代思考,而是用人工智能在你思考时陪伴在你身边。

如果你曾希望学习不再孤单,DeepTutor 绝对值得你花时间体验。


原文链接:DeepTutor: An open-source AI learning assistant that actually understands how humans learn

汇智网翻译整理,转载请标明出处