费曼学习工具
类 NotebookLM 的双模态智能学习系统。融合费曼学习法 + AI 模拟面试 + 间隔复习, 专为 ADHD 友好设计,学习数据写回 Notion 知识库。
S · 我遇到了什么问题
个人背景 + 竞品分析 + 机会判断
我做了 4 年 AI 产品经理,之前在公司负责金融风控 AI 系统——交易前合规检查、规则引擎、实时风险监控这些。 准备换工作的时候发现一个很尴尬的事情:我能设计复杂的风控产品,但面试时让我解释一个 AI 概念(比如 RAG 的工作原理),经常说到一半卡住。
不是不懂,是那种“看的时候觉得全懂了,嘴巴要说的时候才发现有很多模糊地带”的感觉。
每天最大的敌人不是“学不会”,而是“开始不了”。 打开学习资料这个动作本身就要消耗巨大的意志力,很多时候一天就这么过去了。
| 产品 | 做得好的点 | 我遇到的问题 |
|---|---|---|
| NotebookLM | 上传文档后总结与问答体验很好。 | 只做“输入”不做“输出”:不会反过来考你,容易造成“AI 讲得好 = 我懂了”的错觉。 |
| Feynman AI(feynmanai.net) | 让你用自己的话解释概念,再由 AI 打分,方向正确。 | 学完一轮就结束;没有复习提醒;数据不进 Notion;没有面试模拟(需要压力下也能讲清楚)。 |
| StudyTok AI、intellecs.ai | 录音转笔记、闪卡、费曼测试等功能较全。 | 更像一次性练习工具:做完就结束,没有形成“学→考→复习”的循环。 |
| Anki | 间隔复习机制非常强。 | 更适合记忆不适合理解;纯卡片模式对 ADHD 太枯燥,打开成本高、容易逃避。 |
不是说这些产品不好,而是它们各做了一段,没有人把整条链路串起来——尤其是“面试场景考核”,学习工具基本不碰,面试工具又不和学习过程挂钩。 还有一点:几乎没有产品认真考虑过 ADHD 的“启动困难”。
上传资料 → AI 帮你理解 → 你用自己的话复述(费曼) → 面试场景压力测试 → 精准评分找出知识盲点 → 间隔复习薄弱环节 → 数据沉淀到已有知识库
| 产品 | 费曼学习 | 面试模拟 | 间隔复习 | 知识库集成 | ADHD 友好 |
|---|---|---|---|---|---|
| NotebookLM | ❌ | ❌ | ❌ | ❌ | ❌ |
| Feynman AI | ✅ | ❌ | ❌ | ❌ | ❌ |
| Anki | ❌ | ❌ | ✅ | ❌ | ❌ |
| StudyTok AI | ✅ | ❌ | ❌ | ❌ | ❌ |
| Feynman Hub | ✅ | ✅ | ✅ | ✅ | ✅ |
把「读懂 → 讲清楚 → 被考住 → 接着学」串成一条线时的关键体验点。
AI 解析文档后不是给你一堆要点,而是先用大白话说「这篇文章到底在讲什么」,再列核心逻辑,每个观点都标注了原文出处,方便你回去查证。
点击大纲章节标题或思维导图节点,右侧直接进入该知识点的费曼对话。不需要手动复制粘贴,学习流程是连贯的。
同一场面试从概念理解 → 逻辑分析 → 应用场景自动升级。答模糊了会追问,答错了会引导,不会直接给答案。
不是花瓶。自动跟随学习状态计时,完成学习获得经验值升级,连续学习有火焰标记,断了不惩罚只说「欢迎回来」。

T · 我要做什么
产品目标表格 + 约束条件
| 目标 | 说明 |
|---|---|
| 学习效果可量化 | 每个知识点有 0-100 掌握度评分;不是自评,而是 AI 基于你的表达质量打分。 |
| 学和考打通 | 费曼学习结束后可直接进面试模拟;面试暴露的盲点能回到学习环节补。 |
| 数据不孤立 | 所有学习记录写回 Notion,融入已有知识管理体系。 |
| ADHD 能用 | 最低 5 分钟完成一次有效学习:不设目标、不做计划,点一个按钮就能开始。 |
| 约束 | 含义 |
|---|---|
| 一人开发 | 用 Cursor + Claude 辅助编码,目标两周出 MVP。 |
| 低成本 | 个人项目不能烧钱,模型选型需考虑成本。 |
| 链路优先 | 不追求功能多,追求核心链路跑通。 |
A · 我做了哪些决策
5 个决策:标题 + 对比/表格 + 解释
决策一:多模型分工(速度/成本/准确率分层)
一开始想全用 GPT-4,算过账后不现实。最终按场景分配模型:快的跑实时、准的做评估。 这也来自风控经验:实时检测用轻量模型(快),事后审计用重模型(准)。
| 场景 | 模型 | 为什么选它 |
|---|---|---|
| 文档解析 + 费曼对话 | Gemini 3 Flash Preview | 上下文窗口大、速度快、免费额度够个人用。 |
| 面试考核 + 评分报告 | DeepSeek Chat | 推理与判断力更强、成本低;面试对延迟容忍更高。 |
决策二:Prompt 设计是产品设计(费曼 5 轮框架 + 面试官更像真人)
费曼对话 prompt 迭代了十几版:最初“你是老师用费曼技巧教我”会让 AI 自己讲得很清楚, 用户变成被动听讲。后来固定为 5 轮框架,把主动思考与复述强制嵌入对话流程。
| 轮次 | 做什么 | 关键点 |
|---|---|---|
| 1. 建立基础 | 生活化比喻 + 询问现有理解 | 初步解释阶段避免专业术语。 |
| 2. 发现缺口 | 连续 3-5 个问题覆盖关键维度 | 要求用自己的话回答,不能背书。 |
| 3. 迭代改进 | 根据回答逐步加深 | 每次多一个维度。 |
| 4. 检验理解 | 真实场景:讲给完全不懂的朋友 | 把理解落到表达与类比。 |
| 5. 生成教学概要 | 提炼核心概念/最佳类比/关键原理/常见误解 | 输出可沉淀到知识库。 |
面试官 prompt 的关键规则:不要说“根据文档/资料显示”,而是像真人一样自然提问; 难度不让用户选,改为自动递增(概念 → 逻辑 → 应用),避免“永远选基础”。
决策三:用 Notion 当数据层(换来“生态融合”,用工程妥协处理性能)
Notion API 慢、弱、还限流(约 3 req/s),但用户画像(我自己和身边 PM)本来就把知识体系放在 Notion。 如果自建数据库,学习记录会被锁在产品里,与既有笔记体系割裂。
- 面试过程数据暂存前端 state,结束后一次性批量写入。
- 写入串行执行(不 `Promise.all`),遵守 rate limit。
- Dashboard 统计在前端聚合计算,不指望 Notion 做聚合。
如果未来有几千人用,再换数据层;现在过度设计只会拖慢交付。
决策四:ADHD 友好设计(和“常识”反着来)
目标不是“让用户更自律”,而是把启动摩擦降到最低:5 分钟可完成一次有效学习,且只奖励不惩罚。
| 常规做法 | 我的做法 | 为什么 |
|---|---|---|
| 番茄钟 25 分钟倒计时 | 正计时:显示已学多久 | 倒计时制造压力;正计时制造成就感。 |
| 设定今日学习目标 | 只学 5 分钟按钮 | ADHD 最难是启动,不是坚持。 |
| 断更扣分/降级 | 断了只说欢迎回来 | 避免额外内疚感。 |
| 详细计划表 | 打开就看到薄弱点 | 让数据替你做计划。 |
决策五:主动砍掉的功能(宁可三件事做扎实)
默认收起,点击展开。都是真问题上手才遇得到的细节。
▸ PDF 过大导致解析超时
大 PDF(上万字)传给 Gemini 经常超时。表格和图片的解析质量也不稳定——PDF 里嵌的表格经常被识别成乱码。最后的方案是对长文档做分块处理,复杂表格走视觉模型解析。这让我意识到「上传 PDF 一键解析」这个看起来简单的功能,背后有大量的边界情况要处理。
▸ 面试官 AI 太好说话,没有考核价值
第一版面试官无论用户回答什么都说「理解到位」。原因是 prompt 没有设定评价标准。我迭代了三版 prompt,加了评价梯度(优秀 / 及格 / 较差 / 错误)和追问机制。这个经历让我理解了一件事:AI 产品的体验质量,80% 取决于 prompt 设计,不是模型能力。
▸ 面试问的内容和文档完全对不上
有一次面试官在问「进程和线程」,但文档是关于 AGI 的。查了半天发现是前端没把文档内容传给面试 API——典型的「功能看起来做完了但其实是断的」。这也是为什么我后来给每个功能都加了调试日志。
▸ Notion API 的性能和限制
本地开发时 Notion API 频繁超时,排查后发现是翻墙代理干扰了请求。还有 rate limit(每秒 3 请求)和 rich_text 2000 字符限制的问题。这些都是文档上写了但你不踩一遍不会真正注意到的东西。
▸ 语音转文字试了三种方案都不理想
先用 Gemini 转写(太慢,9 个字要 30 秒),再试 Web Speech API(大陆网络连不上 Google 服务),最后发现最好的方案是直接用系统输入法的语音功能。有时候最简单的方案就是最好的方案。
R · 做出来怎么样
成果 + 体感 + 指标设计表格 + 迭代方向 + 教训
- 一周时间(Cursor + Claude 辅助)从零做出可用系统。
- 6 个 API 路由,双模型协作(Gemini + DeepSeek)。
- 费曼学习:文档解析 → AI 对话 → 5 轮框架 → 掌握度评分 → 费曼笔记 → 写入 Notion。
- 模拟面试:配置 → 递增难度 → 追问机制 → 评分报告 → 知识盲点 → 写入 Notion。
- Dashboard:学习热力图 + 掌握度雷达图 + 艾宾浩斯复习提醒。
- 左右面板联动:点击大纲/思维导图节点直接进入费曼对话。
- ADHD 友好:只学 5 分钟入口 + 宠物伴侣系统 + 只奖励不惩罚。
- 以前看完文章就觉得“懂了”,现在会主动进费曼模式讲一遍,常常讲到一半发现没懂。
- 面试模拟几轮后,掌握度从 30-40 分提升到 70-80 分左右,表达更稳定。
- “只学 5 分钟”用得最多:本来只想 5 分钟,进入状态后常常变成半小时。
学习界面、解析能力、面试报告与 Dashboard 数据一览。




| 指标 | 怎么算 | 为什么重要 | 目标 |
|---|---|---|---|
| 周活跃学习天数(北极星) | 每周有学习记录的天数 | 学习类不必天天打开,但要持续;比 DAU 更贴近学习场景。 | ≥ 3 天/周 |
| 启动转化率 | 打开产品 → 开始第一次对话 | 衡量启动门槛是否够低。 | > 60% |
| 学习完成率 | 开始费曼 → 拿到掌握度评分 | 衡量体验是否顺畅,中途放弃是否多。 | > 40% |
| 学→考转化率 | 完成费曼 → 进入面试考核 | 衡量闭环是否形成。 | > 30% |
| 复习回访率 | 收到复习提醒 → 回来复习 | 衡量间隔复习机制是否有效。 | > 25% |
- 最想做的:面试答错的知识点自动加入费曼复习队列(把学→考→复习闭环真正闭上)。
- 需要数据验证的:AI PM 专项题库(可沉淀成垂直壁垒)。
- 时机不对的:认知负荷自适应(需要足够用户数据校准)。
- 不会做的:通用学习平台(差异化在 PM 垂直场景 + Notion 生态 + 面试闭环)。
- 几乎没有真正空白市场,关键是你对现有方案的不满具体在哪里,以及你为什么不一样。
- 砍功能比加功能难:宁可把三个核心功能做扎实,也不要十个半吊子。
- 用自己当第一个用户:创始人就是目标用户的项目,迭代速度最快。
技术架构
架构表格 + 结语