- # why - 解决普通人难以进行的,需要复杂信息和深入思考的**主题研究**问题、个人的研究助理。 - 提升专业人士在主题研究环节的研究效率 - **综合分析**能力:**创造新知的前提**,deep research是实现[[AGI]]5 的重要一步。 - 30 分钟内,完成人类几小时,甚至几天才能完成的工作。 - 人类无法做到的就是 **信息获取、加工处理的算力优势**,deep research 可以在 5-30 分钟内把互联网信息翻个底儿朝天,最强的人类也做不到。 - # what - ## 官方报告 - release date: February 2, 2025 - ### intro - 使用**推理**对大量**在线**信息进行综合分析并通过**多步骤**来完成任务的代理。 - 搜索 - 阅读 - 思考 - 分析 - 是 OpenAI 的下一代 **[[AI agent|agent]]智能体**,能够针对复杂任务,独立在互联网上执行多步骤研究。通过查找、分析、综合分析上百个在线资源,创建一份研究分析师级别的报告。 - 底层采用满血 **[[o3]]模型**,该版本对web 浏览和数据分析进行了优化。 - **system prompt**,deep research的行为很简单,只用到两个工具 - 搜索:利用 o3 模型强悍的推理能力,执行(看似非常基础的)搜索、阅读、引用;分析和整合,会根据自己遇到的信息调整按照研究需要来**调整自身的研究计划(pivoting)**。 - Python:数据处理,表格呈现,加工对象是互联网上的文本、图片、PDF 资料; - ### why we built deep research - **解决学术领域问题**:金融、科学、政策、工程等领域需要彻底、精确、可靠研究的人 - **解决生活领域的问题**:对选购的物品需要仔细、彻底的研究(如汽车、电器、家具) - **deep research可以独立发现、推理、整合来自 web 的见解** - 在真实任务中进行训练,并使用浏览器和 Python 工具 - 使用了与 [[o1]] 相同的强化学习方法[[深度解读“强化微调”,o1模型训练的关键|强化微调]] #todo - 解决现实中的问题需要具备信息搜索能力,和从资源上下文中整合有效信息的能力,deep research 弥补了 o1 在这方面的不足。 - ### how to use deep research - 一次研究会运行 5-30 分钟 - 后期会在报告中嵌入图片、数据可视化、其他分析内容 - ### how it works - 深度研究使用的是[[端到端]]的[[强化学习]],对一系列领域进行 **[[硬浏览]]** 和**推理任务**训练; - 通过这些训练,模型学会了**规划和执行一个多步骤的轨迹来寻找到需要的数据,并在必要时回溯和响应实时信息。**(例如查看 research 的「活动」会看到一个“搜索-阅读-思考-回溯”的活动过程) - ### Limitations - 仍然处于早期阶段,会产生幻觉或做出错误判断 - 主动辨别信息源质量高低、信息真伪,对推理模型来讲这本身不难([[truth-grounding]],事实接地技术) - 难以区分权威信息和谣言 - 目前的一大局限是无法接入付费资源(数据库、学术期刊)和私人知识库等非公开信息,但这可以解决; - ### Access - 计算密集型任务,研究查询所需时间越长,推理计算使用越多,pro 用户每月最多 100 次 - plus、team(1 个月内) - enterprise - ### what's next - 移动端和桌面应用程序(1 个月内) - 目前使用的信源为开放互联网与上传的文件,未来可以连接更专业的数据源 - 异步、真实世界的研究和执行与[[ChatGPT operator]]组合 - # how - ## 使用经验总结 - 在提出问题时,用哪个模型都一样,底层都使用 o3 模型。在回答 GPT 对齐的问题时,model picker 才有用。 - 一定要一个月用完 100 次额度,deep research是自 chatgpt之后最有生产力革命性质的战略性技术/工具,值得战略性重视,所以,主观直接第一手经验的积累至关重要;(与降智斗智斗勇) - **研究报告的最佳阅读方式**:剪藏到 Readwise reader或使用chrome 插件(chatgpt to markdown)导出为 markdown 文件,然后用 typora 或 pandoc 转换为epub 或 pdf(带 link,格式不乱),然后导入微信读书或 readwise reader 边读边划线,阅读 5678 遍; - 暴论:2025 聚焦于阅读 AI 生成的内容。 - 什么情况下用哪种搜索模型: [[SearchGPT]] - 每月限额并非以自然月份划分,而是以你升级会员的具体日期划分;(我是 2.7 付款的,才 20 天不到就降智了) - 报告生成后,你可以在原始对话中继续提出新的研究需求,模型会保持对之前研究的记忆,但本质上是一次新的研究(不会在原始报告上修改,会重新生成新的研究报告); - deep research 对参考文献的引用,精确到“行”。 - 最适合做**读书的主题研究**搭配。 - 对齐需求阶段使用的不是 o3 模型,而是你在 model picker(模型选项卡)里面选择的模型;一般情况下,建议你选择 o1 模型,其次是 gpt-4o 模型;实际差异不大,因为正式研究都是o3 模型,而在理解需求这种简单任务上区别不大 - ## 万能prompt模板 - <研究背景/context> :背景信息,我为什么要做这个研究 - <研究需求/goals> :研究主题,研究目标,需要注意的地方;这个研究是什么,关注什么; - <通用要求/requirements> : - 1、使用英文搜索,只采纳英文资料(因为互联网上英文资料在数量和质量上都是最好的),用中文撰写报告。 - 如果你研究的主题只有中文资料,你或许应该限定模型只用中文关键词搜索,只采纳中文资料 - 2、请解读足够细致深入,字数无上限,一切以深入全面解读为基本目标。(希望你拿出专业分析师的水准。)Your suppose to invoke the deep research function - 3、包含但不限于 Wikipedia、相关书籍、学术和科普期刊网站、权威媒体和杂志刊物的网站; - 4、视觉化,请按需在研究报告中采用图表和可视化媒介,来辅助促进理解; - 可以上传指定文件 - **读书解读 prompt** - 我希望你针对《xxx》这本书进行一次深入、全面的研究与分析,帮我撰写一份高质量的书籍深度解读报告。 - **研究目标** 请确保报告涵盖以下内容: - 书籍的核心主题、关键观点和理论框架的全面总结; - 每个重要观点和理论的详细解释,包括作者提出这些观点的背景、意图及其理论意义; - 对书中涉及的重要案例、事例或研究进行深入分析,并用具体、生动的例子帮助我深入理解; - 作者观点的实际应用价值,包括在现实生活或专业领域中的启示和具体可实践的建议; - 对书籍整体的结构、逻辑和论述风格进行分析与评价; - 请确保报告条理清晰、逻辑严密,同时在必要之处使用适当的引用或原文摘录,以便我能够快速掌握书籍的精髓,达到深入理解与应用的目的; - **通用要求(general requirements)** - **语言选择** 使用英文搜索,只采纳英文资料(因为互联网上英文资料在数量和质量上都是最好的),用中文撰写报告。 - **读者对象** 本报告面向普通读者(自我提升、终身学习、思维训练),并非面向学术研究;但内容上不排斥必要的学术概念和理论,一切以全面深入理解为标准; - **报告长度** 请解读足够细致深入,长度不封顶,一切以深入全面解读为基本目标。 - **参考资料** 请参考Wikipedia、相关书籍、学术和科普期刊网站、权威媒体和杂志刊物的网站;优先选择权威信息源; - **可视化** 请按需在研究报告中采用图表和可视化媒介,来辅助促进理解; - [[deep research prompt 书籍分析]] - [[deep research prompt 电影分析]] - [[Deep Research 翻译]] - [[deep research 写作]] - [[meta prompt:主题研究]] - ## 官方测试 - [[HLE]] 人类最后的考试 - ![](https://image.harryrou.wiki/2025-02-09-CleanShot%202025-02-10%20at%2007.36.04%402x.png) - [[GAIA]] - ![](https://image.harryrou.wiki/2025-02-09-CleanShot%202025-02-10%20at%2007.37.01%402x.png) - 专家及任务 - 图片表面模型浏览和思考的内容越多,表现就越好,更多的时间思考对于模型来说很重要 - ![](https://image.harryrou.wiki/2025-02-09-CleanShot%202025-02-10%20at%2007.39.49%402x.png) - 与人类专家自主做研究的时间对比 - 化学:节省了4 小时 - 语言学:节省了 5 小时 - 医疗学:节省了 2 小时 - ## 和[[Google Gemini with Deep Research]]对比 - 如果对研究的主题不需要深入,只需要广度就可以用 Google。背后原理是因为Google 的上下文长度只有 64k - 重度依赖信息搜集,尤其是中文,英文差距不大。背后原理基于底层搜索引擎,openai 用的是 bing,不如Google search - 指令跟随 instructiong following要求不那么高 - ## [[deep research 测试案例]] - [[如何做读书笔记]]:原文阅读+报告阅读=节省生命时间一大截 - # how good - ![](https://image.harryrou.wiki/2025-02-08-2024-11-28-082711.png) - # Ref. - 知识视频:[[OpenAI Deep Research,让普通人一下变强好几倍的的主题研究 Agent!|深度测评、分析与使用教程]] - [YouTube 直播](https://readwise.io/reader/shared/01jkerpav0y0y17ca8bm0d7mtd) - [OpenAI blog - Introducing deep research | OpenAI](https://readwise.io/reader/shared/01jk5r439xg2pfkdpkxk1tpxkj) - [Deep Research not working with O1 Pro?](https://community.openai.com/t/deep-research-not-working-with-o1-pro/1111868/22) - [我一个月内用了100 次deep research,全部经验一次性分享|万能 prompt、深度经验、报告下载](https://readwise.io/reader/shared/01jn0917qcve2zrk0pywsjag0v) - [candobear deep research研究报告](https://gpt.candobear.com/courses/kv2510-openai-deep-research?__readwiseLocation=) - [什么情况下,20美金的google可以吊打200美金的openai?| deep research 研究](https://readwise.io/reader/shared/01jrq6k1kqd72e4mxaedxsef8b)