# why 搜索引擎的新范式。降低信息输入环节的对人类能力的要求。以前需要你有批判式思维,从海量搜索数据中主动找出并且主动构建,现在不需要了,因为: - ChatGPT search 通过 [[LLM 大语言模型]]来对信息质量进行判断,帮助人类完成了垃圾信息过滤; - 通过检索互联网来增强 gpt 生成的内容质量。 # what searchGPT 与传统搜索引擎的区别 - 主动加工信息、对多个信息资料综合处理给出“现成”答案的能力,同时提供原始网页链接供你验证和“亲自”体验阅读乐趣。 # how ## 搜索使用的分级 | | LLM(4o) | o1 | o3 | deep research | | ----------------- | -------------------------------------------------------------------------------- | --------------------------------------- | ----------------------------------------------------------- | ---------------------------------------------------------------------- | | | predict next token | predict next [[CoT]],think step by step | predict next [[ToT]],**think step by step** | 不止是 thinking,还有 action 行动(更接近[[AI agent]])search - think/reason - read | | [[SearchGPT]]搜索分级 | 4o+search:需要综合多个信息给出一个整体的回答 = 聪明人的几分钟<br>2025.2月的[[grok]]deep research水平,接近推理能力。 | ❌ 不能进行搜索 | o3 mini+search:需要思考的问题,需要多步骤推理过程,最终给出一个权衡、分析后的结果 = 聪明人的几十分钟 | 满血版 o3+search:难度为研究级别,输出结果为千字~万字的研究报告 = 聪明人的几小时、几天 | | | [[context length 上下文长度]]128k,输出长度 16k | | 200k,100k;[[蒸馏模型]]语言能力低于[[GPT-4o]] | 十几万的 token;level3 级别的 AGI;前者无法比较 | ## search是如何工作的? - ChatGPT search 是一个单独的模型,官方称之为搜索模型: - 使用 GPT-4o的微调版本,经过后期训练; - 采用合成数据生成技术:从[[o1-preview]]中提取输出。意思就是使用 o1的数据进行训练,和Alpha zero 一样,光靠人类的数据已经不够了,开始用 AI 训练 AI 了; - 搜索领用的是 bing 搜索 ## 使用方法 - 将地址安装到 google 的搜索引擎设置中 - 用`/`在对话框中调出 gptsearch - citations引用:界面的右侧会提供输出内容的引用 - search result:高质量的链接,但没有被用于生产内容 ![](https://image.harryrou.wiki/2024-12-19-CleanShot%202024-12-19%20at%2013.59.22%402x.jpg) ## 同时使用 searchGPT 和 google 搜索 - 使用[surfingkeys](logseq://graph/feynman_OS-main?page=surfingkeys)插件 - 在 chrome 搜索引擎设置里将默认搜索设置为 searchGPT - 在 chrome 搜索引擎设置里将google 搜索设置快捷键`g`,在搜索框里输入`g+空格` 就会转成 google 搜索了,使用场景 - Wikipedia - 图片 ## 解决中文搜索质量低下的解决方案 ``` 中文问题, search in english, response in chinese ``` ## 支持搜索命令: 1. **site:** 限定特定网站的内容 ```bash site: www.example.com 关键词 ``` 2. **intitle:** 搜索标题中包含特定关键词的页面 ```bash intitle:关键词 ``` 3. **allintitle:** 搜索标题中包含多个关键词的页面 ```bash allintitle:关键词1 关键词2 ``` 4. **inurl:** 搜索URL中包含特定关键词的页面 ```bash inurl:关键词 ``` 5. **allinurl:** 搜索URL中包含多个关键词的页面 ```bash allinurl:关键词1 关键词2 ``` 6. **filetype:** 搜索特定类型的文件 ```bash filetype:pdf 关键词 ``` 7. **“关键词”**:使用引号搜索完全匹配的短语 ```bash "具体短语" ``` 8. **-** 排除包含特定关键词的页面 ```bash 关键词 -排除词 ``` 9. **related:** 查找与特定网站类似的网站 ```bash related:www.example.com ``` 10.**cache:** 查看网页的缓存版本 ``` cache:www.example.com ``` # how good - 我们[[获取信息的范式转变]],信息获取的方式更快、质量更高、更加精准了 # 参考资料 - [ChatGPT 搜索引擎上线。 5 分钟后,我看到 google 搜索的两种死亡。](https://readwise.io/reader/shared/01ja79k7r3r7q90y6abxgxnkr9) - [SearchGPT Prototype](https://readwise.io/reader/shared/01ja7a3p3f9yfpm9x39t70sz0x) - 日报889 - [introducing ChatGPT search](https://readwise.io/reader/shared/01jczqftnadrm6941xnv30j01d) - [the death of search](https://readwise.io/reader/shared/01jczqdwr04qafsgz0tawxba1q) - https://readwise.io/reader/shared/01jczqczh8pa7td5yf45by3ym4 - https://readwise.io/reader/shared/01jczqc7x1rqz6japt8334k4kn - https://readwise.io/reader/shared/01jczqbsbfh3gmt8mrbxvmtf7e - https://readwise.io/reader/shared/01jczqb6q5p3dwdw63n2f0fp74 - https://readwise.io/reader/shared/01jczqaqkm1v8nwsf7aw2egyk7 - [解决中文内容质量地下问题](https://quanzi.xiaoe-tech.com/c_5c1ade1660b8e_66epWNJt6847/feed_detail?community_id=c_5c1ade1660b8e_66epWNJt6847&share_type=12&share_type=12&share_user_id=u_5fe70d591397a_vXMZy5Hozz&share_user_id=u_5fe70d591397a_vXMZy5Hozz&app_id=appDlhUKBqJ1468&feeds_id=d_6763cdd594d70_skXRnNq3NGaZ) - [ChatGPT Search:搜索已死?AI 搜索带来范式革命|08/12 days of openai:search](https://www.youtube.com/watch?v=pgHC7xIPR7w&list=PLZlSADAMEfUB1b4o_LR9661bgsm1hk0i3&index=9)