- 为什么不说理解说编码?
- 理解的范式转换
- 罗塞塔石牌
- transformer
- 这意味着什么?
- 翻译学不存在了
- 大语言模型,本质上知识大模型
- 历史上哲学家们对“理解”的各种理解
- 编码取代理解:从记忆编码到神经网络编码
- 小能熊的编码
- 编码无处不在
- 学习闭环与编码解码
- 编码依赖背景知识
- 人脑如何编码信息?
- 编码方式:只有 4 种
- 举例:acumen
- 深度编码:有效编码的唯一指导原则
# why
## 为什么不说“理解”说“编码”
- ### 理解的范式转换:transformer 创造了智能体“理解”的全新范式
- [[罗塞塔石牌 rosetta stone]]:人类基于规则的理解,人类大脑最擅长的是从复杂的信息中提取模式和规律
- [[transformer]]:通过高维空间的几何关系进行理解
- 人类的理解vsAI智能体的理解
- 大语言模型本质上是知识大模型
- AI 让翻译学不存在了
- ### 历史上哲学家们对“理解”的各种理解
- **古希腊哲学:理解的起源**
- **柏拉图**:主张理想主义,认为理解的对象是不变的“理想形式”,这些形式存在于超越现实的理念世界中。
- **亚里士多德**:强调经验的重要性,认为理解源于感官经验,通过记忆形成经验,再通过抽象和归纳获得知识。他提出“质料”和“形式”的概念,认为形式是事物内在的特性和功能。
- [[说明文 - 概念的分类和界定]]
- **文艺复兴与启蒙时期:理性与经验的探索**
- **约翰·洛克**:在《人类理解论》中提出,所有知识来源于经验,包括感官经验和内省经验。通过观察和抽象形成概念,语言是交流和思考的工具,但语言的模糊性可能导致理解的误差。
- **康德**:调和理性主义和经验主义,提出“先验”和“后验”知识的区分。认为人类通过内在的“范畴”(如因果律、空间、时间)加工经验数据,只能认识现象,而非事物本身。
- **现代哲学:多角度的理解探索**
- **存在主义与现象学**(如海德格尔、胡塞尔):认为理解是人存在的一种基本方式,通过人与世界、他人和自己的关联构建理解。
- **分析哲学**(如维特根斯坦、罗素):关注语言和逻辑在理解中的作用。维特根斯坦提出“语言游戏”概念,认为语言的意义依赖于具体语境,理解世界的关键在于理解语言的使用方式。
- **认知科学:从哲学到科学**
- 20世纪后,认知科学整合心理学、神经科学和人工智能等学科,研究感知、记忆、语言处理等认知过程,为理解机制提供了科学视角。
# what
## “编码”取代“理解”:从记忆编码到神经网络编码
- 从认知心理学、认知神经科学、认知科学的角度来说,对于知识的加工处理统称为“编码”
- 人类对于知识的理解也是在大脑中进行的加工处理。
- [[深度理解模型]]
- **attention - encoding - storage - retrieval**
## 小能熊的编码
- 大脑神经网络加工处理信息 - 提炼为知识砖块 - 与已有知识砖块建立丰富和有意义的关联;
- **知识砖块**:
- 从外部信息中提取和构建心理表征,将信息转化为知识,形成知识砖块,构成我们知识结构的基本单元;
- **知识关联**:
- 在新知和已知之间,在新的知识砖块与已有的知识体系之间,建立丰富、有意义的关联;
- 需要更深层的认知处理,对知识进行分类、归纳、类比,知识被组织和重构,形成更复杂和深入的认识。
- **编码 encoding**:
- 把别人解码输出的信息编码为自己的知识表征,透过他人的线性文字,重新构建文字背后的知识结构;读书、对话、看电影都是在编码;
- 根据自己的现有认知框架、现有的知识和经验对新的信息进行编码,再将新的信息融入个人 Bok;这一过程涉及信息的重组、关联活重新解释。
- **编码依赖背景知识**:
- 对于信息的理解非常依赖个体的知识体系,所以就会出现作者与读者之间的差异;
- 西方谚语:“一千个人眼中有一千个哈姆雷特”
- 怎么办?[[阅读 阅读理解五步法]]
- **解码 decoding**:
- 把自己的思考解码为线性的语言表达;口头费曼、写作都是在解码;
- > **一个作者的目标,就是把网状的思考,用树状的结构,编码成线性的文字。**—— 《风格感觉》Steven Pinker
## 人脑如何编码信息?
### 人脑的 4 种编码方式
人虽然有听觉、视觉、触觉、味觉、嗅觉五种感官来获取信息,但信息在进入大脑被编码的过程只有 4 种编码方式。
- 听觉编码 acoustic encoding
- 通过声音类信息编码
- 26 个字母字母歌
- 视觉编码 visual encoding
- 通过视觉图形进行编码
- **语义编码 semantic encoding**
- 语义编码是对信息的深层加工处理
- 语义编码的重点在于“意义”,只有有意义的信息才能储存在长时记忆中,并在需要的时候被提取使用
- **结构编码 organization encoding** ^505090
- 根据信息的内在结构,对信息进行分类的过程
- 在学习的过程中用树状图、表格或流程图对信息进行分类
- 用单词四步法理解 acumen 这个单词,实际上运用了语义编码与结构编码
### 有效编码的唯一指导原则:深度编码
- **浅层编码**:
- 视觉和听觉编码是浅层的
- 熟视无睹:5 元人民币背后是什么图片?黄山?布达拉宫?人民大会堂?
- 没有被注意力注意到的信息:不会在脑子里留下任何印象
- **深度编码**:
- 语义编码和结构编码是深度的,是对知识的精加工,对于人类大脑来说是更加有效的;
- 对于一个单词:中英文词义、搭配用法、具体场景、例句、同反义词,从词根、词构等角度进行结构编码
- 对于一篇文章,提炼概念、提炼关键词,串联概念,整理出自己的框架,在关键词之间建立链接,与过往知识树进行关联,最终长出一棵有意义且能够解决问题的知识树;
- **深度学习**:
- 信息编码越深,信息加工越深,学习记忆的效果越高效
# how
# how good
- [[模式识别、特征学习、心理表征、概念的关系]]
# Ref.
- [3.2 什么是编码?](https://readwise.io/reader/shared/01jdtexe0qt0f70tmv48wkgdj3)