认知神经科学折现因子 - 朱婉妤的知识库

- Objective: - Breadcrumb: # 概念阐释折现因子（Discount Factor）动物对未来奖励的折现率，这是[[RL 强化学习]]的一个关键产物。折现因子是一个介于0和1之间的值，用符号 γ 表示。当 γ=0 时，算法只关注**即时奖励**，完全忽视未来奖励。当 γ 接近1时，算法在评估当前决策时会考虑**较远未来**的奖励，这意味着长期的回报变得更加重要。 # 实例 # 相关内容 ## 折现因子与延迟满足当大脑中的折现系数足够低的时候，大多数用户都会选择去刷视频，享受当下的劣质多巴胺狂飙，而忽略学习和知识对人生的长远意义。因为，**对于γ足够低的人**，未来是看不见摸不着的，长远的奖励是比不过当下的愉悦。而**对于γ足够高的人**，他会克制住长时间刷视频的欲望，而选择去**读书、运动**，通过优质多巴胺来获得健康的快乐，他能看到短视频等事物对长远人生的负面影响，并控制自己的冲动，调整自己的行为，做出长远的规划，并在当下采取有利于长远的行为。 # 参考资料 - [0.3 人，为什么要学习？](https://www.candobear.com/p/t_pc/course_pc_detail/image_text/i_65c07cebe4b064a83b933e07?community_id=c_65b634d2dd106_nhCXKYc72308&product_id=course_2ba4aSp8cPi3TjgH1xc2GxANJHL) - 《深度学习》谢诺夫斯基 10