构建个性化 AI 教师
我如何使用最新的 Google AI Gemini 3 模型构建一个虚拟教师,平衡教学效率与成本控制。
我经常和我的孩子们一起做作业,我很快意识到育儿和教学的一个普遍真理:知道答案并不等于能够解释清楚。
我可能知道数学问题的解法或历史事件的日期,但用清晰简单的语言解释方法,使其与他们在学校所学的内容一致,是完全不同的挑战。或者有时候他们只是需要另一个观点来理解,因为这更适合他们。
我想要弥合这个差距。我想构建一个不仅计算答案,而且真正作为教学助手的工具。一个理解上下文、适应学生年龄,并使用文字、语音和视觉效果使概念更易理解的虚拟教师。
作为一名 Google 开发者专家,我决定为 Google AI Sprint 解决这个问题。我的目标是使用 Google Apps Script、强大的新 Gemini 3 模型以及 Nano Banana Pro 的惊人的图像生成能力构建一个 Web 应用程序。
本文的代码可以从这里下载。以下是我是如何设计 学生虚拟助手 的。
1、哲学:帮助,而不是解决问题
该应用程序的系统提示非常严格:“目标是帮助学生,而不是解答练习。”
如果学生上传了一张数学题的照片,AI 不应该只是得出“X = 5”。它需要识别主题(例如,勾股定理),解释概念,并引导学生自己解决问题。
为了使这有效,我利用了 Gemini 3 中的新 思考模式 来创建一个类似支持性导师的推理引擎。
2、架构:平衡效率和成本
在构建教育类 AI 应用程序时,成本平衡 是一个关键因素。如果一位老师将此应用部署到一个有 30 名学生的班级,或者如果一所学校采用它,令牌使用量需要可持续。我们需要将容量与成本对齐。
我设计了高效的架构,通过优化步骤拆分逻辑:
2.1 高效分析(思考层级:低)
当学生发送请求(文本或图像)时,我们不需要立即进行复杂的哲学讨论。我们首先需要确定主题。 我第一次调用 Gemini 3,并设置 thinkingLevel 为“low”。
- 输入: 用户文本/图像 + 学生年龄。
- 任务: 提取核心主题并生成一个教育插图的提示。
- 原因: 这是快速的,并优化了分析任务的令牌消耗。
2.2 深入解释(思考层级:高)
一旦确定了主题,我们就会进行第二次并行调用 Gemini 3,并设置 thinkingLevel 为“high”。
- 任务: 作为教师。根据学生的年龄调整语言和复杂度。
- 原因: 在这里,我们投入模型的“脑力”以确保解释具有同理心、教学准确,并适合特定的年级水平。
2.3 使用 Nano Banana Pro 进行可视化
我对 Nano Banana Pro(通过 gemini-3-pro-image-preview 访问)的质量感到惊叹。 在生成文本解释的同时,应用程序会发送请求生成一个 1K 分辨率(16:9)的图像来说明该概念。视觉效果通常是理解抽象概念的关键,而这里的质量令人惊叹。
2.4 语音(零成本)
为了让应用程序更容易访问,我希望教师能“说话”。使用 AI 文本转语音(TTS)API 会增加延迟和成本。
解决方案: 我使用了浏览器的原生 SpeechSynthesis API。它高效、离线工作,并允许学生在不消耗额外 API 配额的情况下听取解释。

3、为什么选择 Google Apps Script?部署优势
我选择 Google Apps Script 不仅是因为它的易于使用,还因为它在教育环境中的强大部署能力。
- 通用访问: 该应用程序被部署为网络应用。这意味着它可以在任何浏览器中运行,适用于任何拥有 Google 账户(gmail.com)的人。
- 教育和办公友好: 对于在 Google Workspace for Education 域工作的教师,部署是无缝的。您可以立即启动这个“AI 教师”并与学生分享链接。
- 安全性和访问控制: 我在后端(Code.gs)实现了过滤系统。您可以限制特定电子邮件地址或整个域(例如,school.edu)的访问。
教师可以部署该应用,但限制其只能让拥有学校电子邮件域的学生访问,从而确保一个安全和受控的学习环境。
4、关键功能
4.1 年龄个性化
这是应用程序的核心。设置中的下拉菜单允许用户选择他们的年龄(6 到 20 岁)。这样可以使它尽可能通用。
- 8 岁: “想象一片披萨……”
- 16 岁: “使用周长公式计算……” 这个变量被注入到每个系统提示中,确保 AI 从不“超越”学生的理解能力。
4.2 “幸运学习” 🍀
有时,学习就是探索。我添加了一个“幸运学习”功能。
- 后端从一个精心策划的课程数据库中随机选择一个主题/科目。
- Gemini 会生成一个关于该主题的引人入胜的问题。
- 学生学到一些新知识,意外且有趣的东西。
4.3 持续学习流程
学习不会在一次回答后停止。我实施了 “继续学习” 按钮。 在解释之后,应用程序会利用上下文并要求 Gemini 生成后续问题或深入探讨同一主题。它保持对话继续,将单个问题转化为一个课程计划。
5、结束语
生成式 AI 有可能在全球范围内普及高质量的辅导资源。通过结合 Gemini 3 的推理能力、Nano Banana Pro 的视觉创造力以及 Google Apps Script 的灵活性,我们可以构建智能、经济上可行且易于部署的工具。
原文链接:Building a personalized AI Tutor with Gemini 3, Nano Banana Pro, and Google Apps Script
汇智网翻译整理,转载请标明出处