# 检查清单
- [ ] 豆瓣短评
- [ ] twitter 分享
- [ ] 圈子分享
- [ ] 文章分享
- [ ] 家人、朋友分享
# why
- **《我看见的世界》**,作者是李飞飞(Fei-Fei Li)。这是一本回忆录,主要讲述了作者从中国移民到美国的成长经历,以及她如何在人工智能(AI)和计算机视觉领域取得突破性的成就。
# what
### **1. 个人成长经历**
- 李飞飞出生于中国,童年时期在成都度过。她的家庭后来移民到美国,生活艰辛,母亲在洗衣店工作,而她需要承担许多家庭责任。选择移民的原因主要是母亲认为当时中国的教育环境不适合李飞飞的发展,男女不平等,不希望孩子有更多地探索。
- 在适应美国生活的过程中,她克服了语言障碍和文化冲突,并努力在学业上取得优异成绩。
- 在高中阶段遇到了重要的人生导师鲍勃,他们跨越文化差异,都读过相同的世界名著。后来李飞飞与鲍勃一家成为了一生的亲人。
### **2. 学术与职业生涯**
- 进入普林斯顿大学后,她在物理和计算机科学领域展开研究,并最终走向人工智能(AI)和计算机视觉方向。
- 她的研究专注于如何让计算机理解和识别图像,这促成了**ImageNet**项目的诞生。
- ImageNet 彻底改变了 AI 领域,推动了深度学习在计算机视觉中的应用,使得 AI 在图像识别方面取得突破性进展。
- 她在斯坦福大学担任教授,并致力于推动 AI 的公平性和多样性,倡导“以人为本的 AI”。
- **[[ImageNet]] 的起源与发展**
### **3. AI 伦理与社会影响**
- 她强调 AI 不能仅仅由少数科技公司或国家主导,而应该服务于全人类。
- 她提倡负责任的 AI 发展,关注 AI 在医疗、教育等领域的应用。
- 作为少数进入 AI 领域的华裔女性科学家,她一直关注**科技行业的性别和种族不平等问题**。
- 2017 年,她创立了 **[[AI4ALL]]**,一个致力于让女性和少数族裔进入 AI 领域的教育项目。
- 她强调 AI 不能只由少数科技巨头掌控,而应该服务于全人类,确保 AI 的发展符合伦理,避免算法偏见。
### **4. 个人使命与愿景**
- 她不仅是一位科学家,也是一名教育者,希望通过技术改善社会,尤其是在医疗领域利用 AI 帮助医生诊断疾病。
- 她积极推动 [[STEM 教育]],特别是支持女性和少数族裔进入科技领域。
# how
- 如坐针毡的华盛顿执行
- 逐梦之旅
- 鸿沟渐窄
- 心智探索
- 第一道光
- [[阅读实例 眼睛的诞生]]的寒武纪大爆发,导致生命开始出现意识,视觉和触觉种种信号汇集最终形成了大脑。
- *📌 ==与早期的光敏感性一样,新生的神经末梢也遍布原始生物的体表,传递触觉信号。这些神经细胞不断生长并相互连接,形成了所谓的“神经网络”。这种分散的网络是中枢神经系统的前身,而中枢神经系统最终将成为更高级生命形式的特征 ==> 📌 ==随着感官所提供的信息深度和数量不断增加,生物体处理信息的工具也面临着增长的压力,类似我们需要更多更加复杂的计算设备来管理现代世界中的海量数据。为了处理五花八门的信息,神经系统不断发展,最终形成一个集中枢纽,其中的组成部分被越来越密集地压缩到一个器官里。我们把这个器官称为大脑。 📌 ==因此,大脑并不是内部某种神秘的智力火花的产物,而是对外部世界的反应。愈加清晰和纷杂的外部世界影像,通过感官到达生物体内部,感知周围环境的能力促使我们发展出了整合、分析并最终理解这种感知的机制。==视觉就是感知系统最为活跃的组成部分。 *
- **看到即理解**,我们不仅仅是看到物体本身的颜色、形状,而是看见的同时我们已经理解了。
- *📌 从人工智能领域发展早期,这样的可能性就一直诱惑着研究人员。然而,他们很快就意识到,视觉理解的挑战极其复杂,这一点也被此后的每一代人反复证实。==首先就是数据本身==。数字图像是以像素的形式存储的,也就是说,单个颜色点用数字编码表示,因此在机器看来,像素只不过是一长串整数。如果算法想要像人类一样,根据有意义的概念(如人物、地点和事物)来理解图像,就必须对这个列表进行筛选,并找出以某种方式对应的数字模式。遗憾的是,定义这种数字模式的难度很大,即使是定义直线或几何形状这样的简单概念也很难。人脸识别更是难上加难,因为人脸是有机体,变量非常多:肤色、比例、拍摄角度、光线条件、图像背景等,组合种类繁多,极其复杂。从数据开始,谜题越来越难。例如,人类在看到事物之后,会形成更深层次的理解,那么被动观察行为和理解行为之间的界限究竟在哪里?我们对影像的感知包括由边缘和纹理形成的一团团的色块,我们会下意识地解读这些色块,这是一种纯粹的感知体验。而在我们有意识地处理所看到的东西之前,有多少次是下意识地看到了图像?研究人员很快就发现两者不可分割:==看到即理解==,因此科学挑战既存在于感官层面,又存在于智力层面。所以,==视觉不仅仅是我们对智力的应用,实际上,它就是智力的同义词。这就是视觉的魔力==。视觉是一种非常精细的技能。虽然我们看到的世界只是光线恰好落在我们眼睛表面的映射,但我们从光线中获得的信息却能延伸到我们的全部经验。从感官输入到可靠、可操作的知识,这是一种近乎奇迹的转变,是人类大脑最了不起的一大能力。仅仅是转换任务的计算成本,就远远超过了仓库大小的超级计算机的计算能力,而对人类来说,所有这些都是由一个直径约12.7厘米的潮湿有机块体完成的。人脑对概念的认知深度让学术界的杰出人士也常怀谦卑之情。==要解开视觉之谜,并不仅仅是理解“人类如何看见事物”这么简单。视觉问题并不是简单的关于颜色或形状的问题,也不仅仅是在更大级别上进行数字运算的问题。视觉研究是对人类认知中一个核心现象的探索。视觉在很大程度上是人类身份和独特性的基础,无论是在生物学上、人际关系方面,还是在文化层面。研究视觉是通往我们体验最基础层面的旅程。很多时候,“所见即所知”,因此,了解我们如何看见,就是了解我们自己。 ==*
- 北极星
- 李飞飞做了大量的外部视觉实验,即通过被试看一些图像来进行判断,比如实验发现人们在关注一个特定的目标的同时,吸收周围环境的信息几乎是下意识的。
- *脑电图和功能性磁共振成像[[fMRI]]: ==脑电图测量的是整个大脑的电脉冲,它以极快的速度在大脑表面扩散,而功能性磁共振成像则通过检测特定区域的神经元活动,来测量血氧水平的变化==。研究早期的突破包括发现了“梭状回面孔区”(Fusiform Face Area,FFA),这是颞叶的一个皮质区域,大小不超过一立方厘米,似乎是为识别人脸而量身定做的。接下来是附近的“海马旁回位置区”(Parahippocampal Place Area,PPA),在识别熟悉的地点(比如自家厨房或常走的道路)方面发挥着类似的作用。另一个发现是“纹外躯体区”(Extrastriate Body Area,EBA),可以对周围人的手臂和腿等部位的摆动情况做出反应,帮助我们感知他们的身体方向。这些被称为视觉神经关联的结构有一些特别之处:它们似乎都是为特定目的专门打造的。每个结构都能且只能识别特定类别的事物,如面孔、熟悉的地点、身体姿势等。这就解释了为什么我们在完成特定的识别任务时,能够达到惊人的感知速度。我们不需要从头开始,逐个细节地进行解码;我们神经系统的一个专用功能会立即启动,几乎在瞬间就能完成识别任务。从我们的感受来看,这种识别是毫不费力的。 *
- 一个假设
- 实验验证
- 万物以外是什么
- 似易实难
- 无人可控
- 下一个可北极星
# how good
- 这本书不仅是关于人工智能的突破,更是关于毅力、成长以及科技与人文结合的故事。
- [[哈勃深场]]
# inbox
# todo
# ref.
- [ ] 豆瓣链接
- [ ] [《我看见的世界》deep research 深度解读报告](https://readwise.io/reader/shared/01jn5cxe2vzbwzn1mzs6yjfpx0)
# related.
# archive.