# why - **为什么要做 project?** - 每一次和 ChatGPT 的聊天窗口都是一次对话的最小单位,一个 idea、概念,如果想要聊其他内容就需要再开一个窗口,所以整个 UI 界面里会有很多很多聊天内容。 - 同一个概念需要在一个窗口下进行不定期的对话,因为 GPT 在回复时不仅使用的是模型里面的万亿参数,还包括一次对话里面的所有内容。 - **原理** - 为什么 GPT 能够实现高效、精准、快速的只是提取?与搜索引擎的关键词搜索有何不同? - [[RAG 检索增强生成]] - 语义检索 vs 关键词匹配 - 在理解后的重新输出 vs 内容是人类早就写好的 - [[Embedding]]技术 - [[词嵌入]] - [[语义空间]] - [[OpenAI Embedding]] # what - project是[[ChatGPT]]UI 页面上的项目文件夹功能。这个功能的之所以叫project,而不是 folder是因为它支持管理一个项目所需要的功能。 # how - **主要功能与使用思考** - context,上传文档附件 - 上传整本书,用 GPT 的大语言模型和 Chat 模式,相当于拥有了一位随时在线和你一起分析理解一本书的朋友。 - custom prompt,自定义指令 - conversation folder,对话文件夹 - **一本书**(但是更好的方式是 NotebookLM) - 一个主题的工作、学习项目管理 - 与主题学习、工作项目同步 - **企业内部知识库问答** - 解决各类问题生活助理 - 家庭助理:Wi-Fi 修理、电器修理 - Apple 使用手册 - 深刻思考与闲聊有趣的话题 - 重要的内容可以剪藏到 Readwise reader 中划线,重读 - model selection,模型选择 - 支持上传文档、[[ChatGPT Canvas|画布]]、图片(仅 4o) - **一些目前没有实现的功能** - 不支持检索? - 联网 - GPTs 下的对话无法归档 # how good ## 与[[GPTs]]比较 - 共同点 - 名称、指令、上传文件 - 功能:联网、画布、图片生成、代码解译器和数据分析 - 不同点 - 文件夹管理功能 - 模型选择 ## 费曼 - 给大家介绍一个 ChatGPT 交互界面里的小功能:ChatGPT project,它有四个部分组成: 1. 上传文件 2. 定制 prompt 3. 文件夹功能 4. 模型选择(4o、o1) - 我们与 GPT 的聊天可以在单独文件夹下进行。此功能看上去像是一个简单的文件夹分类功能,但其实它有个很强大的功能 - 建立【专有领域】的知识库,就是通过【上传文件】功能。 - 比方说上传一本书到 project 文件夹。然后我们在此文件夹里所有的对话,gpt 都会基于它的理解来与你进行交互。这就相当于你有一个书童,ta 能够与你进行对话。而不是一台复读机,只会把原文内容照本引用。也不是搜索引擎,只会机械地进行关键词匹配。 - 原理 - 这里运用的技术叫【RAG 检索增强生成】,如果使用 cmd+k 进行检索就会发现,gpt 并不是关键词匹配,而是在上传的文件中根据【语义】进行的检索。然后再根据“理解”进行的生成。RAG 就是让模型在小范围的、高精准的文件中进行检索,进而增强了生成的内容质量,减少模型出现幻觉的可能性。 - 这里指的理解与大模型中的 【embeddings】这个概念有关,可以简单理解为,大语言模型用数学的方式理解了人类的语言,形成了一个高维度的语义空间,在这个空间里,意思相近的词就会离得很近。 - 解决什么问题?大语言模型是用所有互联网数据进行训练的,所以在回答特别定制化问题的时候可能会出现幻觉。但是如果用模型的万亿参数➕私人数据库,就会得到一个定制化的模型。 - 此类的产品还有 [[NotebookLM]] # Ref. - [youtube-ChatGPT Projects:RAG 和embedding 的底层原理|07/12 days of openai](https://readwise.io/reader/shared/01jjqsrp0vy0xbdw3q4zarnsd6)