← 返回首页
Projects

费曼学习工具

类 NotebookLM 的双模态智能学习系统。融合费曼学习法 + AI 模拟面试 + 间隔复习, 专为 ADHD 友好设计,学习数据写回 Notion 知识库。

Gemini 2.5DeepSeekNext.jsNotion APIMermaid.jsVercel AI SDK
费曼学习工具 学习页面:双栏布局与费曼对话
产品学习界面全貌
Quick nav
一句话:让「学会」这件事可被验证,而不是靠自我感觉。

S · 我遇到了什么问题

个人背景 + 竞品分析 + 机会判断

个人背景

我做了 4 年 AI 产品经理,之前在公司负责金融风控 AI 系统——交易前合规检查、规则引擎、实时风险监控这些。 准备换工作的时候发现一个很尴尬的事情:我能设计复杂的风控产品,但面试时让我解释一个 AI 概念(比如 RAG 的工作原理),经常说到一半卡住。

不是不懂,是那种“看的时候觉得全懂了,嘴巴要说的时候才发现有很多模糊地带”的感觉。

每天最大的敌人不是“学不会”,而是“开始不了”。 打开学习资料这个动作本身就要消耗巨大的意志力,很多时候一天就这么过去了。

我试过的现有工具
工具对比(我为什么不满足)
产品做得好的点我遇到的问题
NotebookLM上传文档后总结与问答体验很好。只做“输入”不做“输出”:不会反过来考你,容易造成“AI 讲得好 = 我懂了”的错觉。
Feynman AI(feynmanai.net)让你用自己的话解释概念,再由 AI 打分,方向正确。学完一轮就结束;没有复习提醒;数据不进 Notion;没有面试模拟(需要压力下也能讲清楚)。
StudyTok AI、intellecs.ai录音转笔记、闪卡、费曼测试等功能较全。更像一次性练习工具:做完就结束,没有形成“学→考→复习”的循环。
Anki间隔复习机制非常强。更适合记忆不适合理解;纯卡片模式对 ADHD 太枯燥,打开成本高、容易逃避。
我看到的机会

不是说这些产品不好,而是它们各做了一段,没有人把整条链路串起来——尤其是“面试场景考核”,学习工具基本不碰,面试工具又不和学习过程挂钩。 还有一点:几乎没有产品认真考虑过 ADHD 的“启动困难”。

上传资料 → AI 帮你理解 → 你用自己的话复述(费曼) → 面试场景压力测试
  → 精准评分找出知识盲点 → 间隔复习薄弱环节 → 数据沉淀到已有知识库
竞品对比矩阵(定位对比)
产品费曼学习面试模拟间隔复习知识库集成ADHD 友好
NotebookLM
Feynman AI
Anki
StudyTok AI
Feynman Hub
✅ 用青色强调,❌ 用暗灰色;最后一行高亮展示完整闭环能力。
产品核心特色

把「读懂 → 讲清楚 → 被考住 → 接着学」串成一条线时的关键体验点。

大白话翻译 + 溯源标注

AI 解析文档后不是给你一堆要点,而是先用大白话说「这篇文章到底在讲什么」,再列核心逻辑,每个观点都标注了原文出处,方便你回去查证。

双向跳转联动

点击大纲章节标题或思维导图节点,右侧直接进入该知识点的费曼对话。不需要手动复制粘贴,学习流程是连贯的。

面试考核自动递增难度

同一场面试从概念理解 → 逻辑分析 → 应用场景自动升级。答模糊了会追问,答错了会引导,不会直接给答案。

宠物伴侣系统

不是花瓶。自动跟随学习状态计时,完成学习获得经验值升级,连续学习有火焰标记,断了不惩罚只说「欢迎回来」。

AI 大纲、大白话翻译与溯源标注界面

T · 我要做什么

产品目标表格 + 约束条件

一句话:让“学会”这件事可以被验证,而不是靠自我感觉。
产品目标(拆解)
目标说明
学习效果可量化每个知识点有 0-100 掌握度评分;不是自评,而是 AI 基于你的表达质量打分。
学和考打通费曼学习结束后可直接进面试模拟;面试暴露的盲点能回到学习环节补。
数据不孤立所有学习记录写回 Notion,融入已有知识管理体系。
ADHD 能用最低 5 分钟完成一次有效学习:不设目标、不做计划,点一个按钮就能开始。
给自己的约束(MVP 约束条件)
约束含义
一人开发用 Cursor + Claude 辅助编码,目标两周出 MVP。
低成本个人项目不能烧钱,模型选型需考虑成本。
链路优先不追求功能多,追求核心链路跑通。
学习闭环流程图(从输入到复习)
正在渲染图表...

A · 我做了哪些决策

5 个决策:标题 + 对比/表格 + 解释

决策一:多模型分工(速度/成本/准确率分层)

一开始想全用 GPT-4,算过账后不现实。最终按场景分配模型:快的跑实时、准的做评估。 这也来自风控经验:实时检测用轻量模型(快),事后审计用重模型(准)。

模型架构图(前端 / API / 模型 / 数据)
正在渲染图表...
模型分工(按场景选型)
场景模型为什么选它
文档解析 + 费曼对话Gemini 3 Flash Preview上下文窗口大、速度快、免费额度够个人用。
面试考核 + 评分报告DeepSeek Chat推理与判断力更强、成本低;面试对延迟容忍更高。
决策二:Prompt 设计是产品设计(费曼 5 轮框架 + 面试官更像真人)

费曼对话 prompt 迭代了十几版:最初“你是老师用费曼技巧教我”会让 AI 自己讲得很清楚, 用户变成被动听讲。后来固定为 5 轮框架,把主动思考与复述强制嵌入对话流程。

费曼 5 轮流程图(纵向时间线)
第 1 轮 · 建立基础
生活化比喻 + 了解用户水平
第 2 轮 · 发现缺口
3-5 个问题覆盖:是什么 / 为什么 / 边界 / 区别
第 3 轮 · 迭代改进
逐步加深,每次多一个维度
第 4 轮 · 检验理解
真实场景:解释给不懂的朋友
第 5 轮 · 教学概要
核心概念 / 最佳类比 / 关键原理 / 常见误解
费曼对话 · 5 轮框架
轮次做什么关键点
1. 建立基础生活化比喻 + 询问现有理解初步解释阶段避免专业术语。
2. 发现缺口连续 3-5 个问题覆盖关键维度要求用自己的话回答,不能背书。
3. 迭代改进根据回答逐步加深每次多一个维度。
4. 检验理解真实场景:讲给完全不懂的朋友把理解落到表达与类比。
5. 生成教学概要提炼核心概念/最佳类比/关键原理/常见误解输出可沉淀到知识库。

面试官 prompt 的关键规则:不要说“根据文档/资料显示”,而是像真人一样自然提问; 难度不让用户选,改为自动递增(概念 → 逻辑 → 应用),避免“永远选基础”。

决策三:用 Notion 当数据层(换来“生态融合”,用工程妥协处理性能)

Notion API 慢、弱、还限流(约 3 req/s),但用户画像(我自己和身边 PM)本来就把知识体系放在 Notion。 如果自建数据库,学习记录会被锁在产品里,与既有笔记体系割裂。

针对 Notion 的妥协
  • 面试过程数据暂存前端 state,结束后一次性批量写入。
  • 写入串行执行(不 `Promise.all`),遵守 rate limit。
  • Dashboard 统计在前端聚合计算,不指望 Notion 做聚合。

如果未来有几千人用,再换数据层;现在过度设计只会拖慢交付。

决策四:ADHD 友好设计(和“常识”反着来)

目标不是“让用户更自律”,而是把启动摩擦降到最低:5 分钟可完成一次有效学习,且只奖励不惩罚。

ADHD 友好设计原则(对照表)
常规做法我的做法为什么
番茄钟 25 分钟倒计时正计时:显示已学多久倒计时制造压力;正计时制造成就感。
设定今日学习目标只学 5 分钟按钮ADHD 最难是启动,不是坚持。
断更扣分/降级断了只说欢迎回来避免额外内疚感。
详细计划表打开就看到薄弱点让数据替你做计划。
决策五:主动砍掉的功能(宁可三件事做扎实)
情绪检测(语音分析认知负荷)
原理可行但准确率难自证,做成半成品会更扣分。
SM-2 间隔复习算法
需要大量数据才能收敛;当前数据量小,用简化版更稳定。
多用户社交功能
一个人都没用好之前就做社交,是“解决方案先于问题”。
开发过程中的真实踩坑

默认收起,点击展开。都是真问题上手才遇得到的细节。

▸ PDF 过大导致解析超时

大 PDF(上万字)传给 Gemini 经常超时。表格和图片的解析质量也不稳定——PDF 里嵌的表格经常被识别成乱码。最后的方案是对长文档做分块处理,复杂表格走视觉模型解析。这让我意识到「上传 PDF 一键解析」这个看起来简单的功能,背后有大量的边界情况要处理。

▸ 面试官 AI 太好说话,没有考核价值

第一版面试官无论用户回答什么都说「理解到位」。原因是 prompt 没有设定评价标准。我迭代了三版 prompt,加了评价梯度(优秀 / 及格 / 较差 / 错误)和追问机制。这个经历让我理解了一件事:AI 产品的体验质量,80% 取决于 prompt 设计,不是模型能力。

▸ 面试问的内容和文档完全对不上

有一次面试官在问「进程和线程」,但文档是关于 AGI 的。查了半天发现是前端没把文档内容传给面试 API——典型的「功能看起来做完了但其实是断的」。这也是为什么我后来给每个功能都加了调试日志。

▸ Notion API 的性能和限制

本地开发时 Notion API 频繁超时,排查后发现是翻墙代理干扰了请求。还有 rate limit(每秒 3 请求)和 rich_text 2000 字符限制的问题。这些都是文档上写了但你不踩一遍不会真正注意到的东西。

▸ 语音转文字试了三种方案都不理想

先用 Gemini 转写(太慢,9 个字要 30 秒),再试 Web Speech API(大陆网络连不上 Google 服务),最后发现最好的方案是直接用系统输入法的语音功能。有时候最简单的方案就是最好的方案。

R · 做出来怎么样

成果 + 体感 + 指标设计表格 + 迭代方向 + 教训

产品成果
  • 一周时间(Cursor + Claude 辅助)从零做出可用系统。
  • 6 个 API 路由,双模型协作(Gemini + DeepSeek)。
  • 费曼学习:文档解析 → AI 对话 → 5 轮框架 → 掌握度评分 → 费曼笔记 → 写入 Notion。
  • 模拟面试:配置 → 递增难度 → 追问机制 → 评分报告 → 知识盲点 → 写入 Notion。
  • Dashboard:学习热力图 + 掌握度雷达图 + 艾宾浩斯复习提醒。
  • 左右面板联动:点击大纲/思维导图节点直接进入费曼对话。
  • ADHD 友好:只学 5 分钟入口 + 宠物伴侣系统 + 只奖励不惩罚。
使用体感
  • 以前看完文章就觉得“懂了”,现在会主动进费曼模式讲一遍,常常讲到一半发现没懂。
  • 面试模拟几轮后,掌握度从 30-40 分提升到 70-80 分左右,表达更稳定。
  • “只学 5 分钟”用得最多:本来只想 5 分钟,进入状态后常常变成半小时。
产品截图

学习界面、解析能力、面试报告与 Dashboard 数据一览。

学习页面全貌:双栏布局与费曼对话
截图一学习页面全貌(双栏布局 + 费曼对话)
AI 大纲、大白话翻译与溯源标注
截图二AI 大纲 + 大白话翻译 + 溯源标注
模拟面试评分报告界面
截图三面试评分报告
学习 Dashboard:热力图、雷达图与复习提醒
截图四Dashboard(热力图 + 雷达图 + 复习提醒)
如果有 10 万用户,我会看什么指标(指标设计)
指标怎么算为什么重要目标
周活跃学习天数(北极星)每周有学习记录的天数学习类不必天天打开,但要持续;比 DAU 更贴近学习场景。≥ 3 天/周
启动转化率打开产品 → 开始第一次对话衡量启动门槛是否够低。> 60%
学习完成率开始费曼 → 拿到掌握度评分衡量体验是否顺畅,中途放弃是否多。> 40%
学→考转化率完成费曼 → 进入面试考核衡量闭环是否形成。> 30%
复习回访率收到复习提醒 → 回来复习衡量间隔复习机制是否有效。> 25%
如果继续迭代
  • 最想做的:面试答错的知识点自动加入费曼复习队列(把学→考→复习闭环真正闭上)。
  • 需要数据验证的:AI PM 专项题库(可沉淀成垂直壁垒)。
  • 时机不对的:认知负荷自适应(需要足够用户数据校准)。
  • 不会做的:通用学习平台(差异化在 PM 垂直场景 + Notion 生态 + 面试闭环)。
回头看,最大的教训
  1. 几乎没有真正空白市场,关键是你对现有方案的不满具体在哪里,以及你为什么不一样。
  2. 砍功能比加功能难:宁可把三个核心功能做扎实,也不要十个半吊子。
  3. 用自己当第一个用户:创始人就是目标用户的项目,迭代速度最快。

技术架构

架构表格 + 结语

技术栈分层图
前端
Next.js + Tailwind + Mermaid
AI
Gemini Flash + DeepSeek Chat
Vercel AI SDK (streaming)
数据
Notion API · Vercel 部署

这个项目是我用 Cursor + Claude 一周做出来的。不是为了证明我会写代码,在解决个人需求的同时,也想证明一个 AI PM 可以从洞察到交付独立完成一个产品——包括需求分析、竞品调研、技术选型、prompt 设计、数据架构、和用户体验设计。