- Objective: - Breadcrumb: # 概念阐释 折现因子(Discount Factor)动物对未来奖励的折现率,这是[[RL 强化学习]]的一个关键产物。折现因子是一个介于0和1之间的值,用符号 γ 表示。当 γ=0 时,算法只关注**即时奖励**,完全忽视未来奖励。当 γ 接近1时,算法在评估当前决策时会考虑**较远未来**的奖励,这意味着长期的回报变得更加重要。 # 实例 # 相关内容 ## 折现因子与延迟满足 当大脑中的折现系数足够低的时候,大多数用户都会选择去刷视频,享受当下的劣质多巴胺狂飙,而忽略学习和知识对人生的长远意义。因为,**对于γ足够低的人**,未来是看不见摸不着的,长远的奖励是比不过当下的愉悦。 而**对于γ足够高的人**,他会克制住长时间刷视频的欲望,而选择去**读书、运动**,通过优质多巴胺来获得健康的快乐,他能看到短视频等事物对长远人生的负面影响,并控制自己的冲动,调整自己的行为,做出长远的规划,并在当下采取有利于长远的行为。 # 参考资料 - [0.3 人,为什么要学习?](https://www.candobear.com/p/t_pc/course_pc_detail/image_text/i_65c07cebe4b064a83b933e07?community_id=c_65b634d2dd106_nhCXKYc72308&product_id=course_2ba4aSp8cPi3TjgH1xc2GxANJHL) - 《深度学习》谢诺夫斯基 10