# why
- 概率思维能够防止我们总是把事情[[一分为二]],人们更加偏爱确定性,黑白分明,因为简化的、确定性的更有安全感。
- *芒格说,如果你不理解基本概率,你的生活就像单腿参加踢屁股比赛,给了别人巨大优势。在他看来,以概率方式思考是投资者的基本素养。对普通人来说,如果你不考虑概率,你就不会真正理解世界。*
# what
- 概率思维:是一种用**概率而非确定性**来解决问题的思维方式。
- 现实世界中的很多事情并不是黑白分明,而是介于可能与不可能之间,带有某种程度的随机性。
# how
- **基本概念**
- 事件:概率论中的“事件”是指一个或一组可能的结果。例如,掷骰子得到“6”是一个事件。
- 概率:事件发生的可能性,用 0 到 1 之间的数值表示。
- 条件概率:在已知某件事会发生的情况下,另一件事会发生的概率。例如,已知阴天,下雨的概率会是多少。
- **贝叶斯定理(Bayes' Theorem)**:通过已知条件(B)概率来计算未知事件(A)的条件概率。如果已知条件变了,那么未知事件的概率也会更新。
- $P(A|B)=P(B)P(B|A)·P(A)$ :
- [[011 贝叶斯更新 Bayesian Updating]]
- **期望值(Expected Value)**:各种可能结果的收益(或损失)与其概率的加权平均,为决策提供了量化依据。
- $期望值= \sum(结果 i × 概率 i)$
- 例如:假设你在考虑是否参加一场赌局:有60%的概率赢得100元;有40%的概率输掉50元。期望值计算如下:$0.6×100 +0.4×(-50)=60-20=40$ 。期望值为正40元,表明从长期来看,这场赌局对你有利。
- **正态分布(Normal Distribution)**:常见的对称分布、钟形曲线,很多自然现象近似遵循正态分布(比如身高、考试成绩)。
- 正态分布能够帮助我们更全面地评估风险,而不是只看到平均值([[一分为二]]中的男女生考试成绩)
- **应用场景**
- 投资与商业决策
- 生活与个人决策
- 职业选择:读研的机会成本;就业后的收入成长、风险与回报等等,为选择估算成功与失败的概率,而不仅仅凭“去大公司更好”。
- 健康医疗:不因检测出异常而恐慌,也不应指标都正常就掉以轻心。
- 消费理财
- **概率思维的敌人**
- 诺贝尔经济学奖的主、[[《思考,快与慢》]]的作者丹尼尔·卡尼曼认为,人类大脑天生无法很好地处理概率(The human mind is not designed to deal with probabilities very well)。概率思维的敌人,是人类大脑里的一系列“[[认知偏差]](Cognitive Bias)”
- **如何训练概率思维**
- 利用统计工具和数据
- 使用简单的概率模型:加法规则、乘法规则、贝叶斯公式。比如在多重因素叠加时,你可以将事件拆分成若干独立或条件独立的子事件,再逐步计算概率。
- 建立“场景分析”习惯 在做重要决策前,多问自己几个问题:“最坏结果是什么?它的概率是多少?这会给我造成怎样的损失?”“最理想结果是什么?它大概几率有多大?”在不断拆解与衡量的过程中,你会发现自己更能看清利弊,也更能分辨哪些前提过于乐观或悲观。
- 对照实际结果进行复盘
- 刻意向外部征求反馈:在大多数情形下,我们无法独自客观地评估所有变量。找一两个在领域内有经验、思维严谨的人进行探讨,可以帮助我们校正偏差。真正的概率思维者并不排斥与别人对话,而是把他人的观点看作修正自己概率估计的一个信息源。
# how good
- 只有接受了**不确定性才是世界的常态**才算是理解了真实的世界,总是抱着确定的“理想”,那只会觉得世界怎么总是和我作对。用概率思维把握人生的确定性。
- **举例子**:喜欢把事情简化成黑白对立面的新闻并不能说明事实,而无法从事实中产生思考。只是利用了我们的[[系统性误判]],因为我们本能地喜欢简单、确定的事。[[影响力三级笔记]]中有一个故事,在一个“超自然冥想术研讨会”上,有人运用理性说明了这件事情不靠谱的原因,但反而促进了现场掏钱加入冥想社的订单。原因就是这位运用理性的人给大家制造了不确定性,因此带来了焦虑,而解决焦虑的办法就是花钱,交给他人,自己就不焦虑了。🤣同用价钱衡量教培质量。
- 其他概率:
1. **描述性统计(Descriptive Statistics)** 这些方法用于总结和描述数据的基本特征。
- **均值(Mean)**:数据的算术平均值。
- **中位数(Median)**:数据的中间值,将数据按大小排序后,位于中间的数值。
- **众数(Mode)**:数据中出现频率最高的数值。
- **方差(Variance)**:衡量数据分散程度的度量。
- **标准差(Standard Deviation)**:方差的平方根,表示数据偏离均值的程度。
2. **概率分布(Probability Distributions)** 概率分布描述随机变量的可能值及其概率。
- **正态分布(Normal Distribution)**:常见的对称分布,很多自然现象近似遵循正态分布(比如身高、考试成绩)。
- **二项分布(Binomial Distribution)**:用于描述有两个可能结果的离散事件,如抛硬币。
- **泊松分布(Poisson Distribution)**:用于描述单位时间或单位区域内某事件发生的次数,常用于稀有事件。
- **指数分布(Exponential Distribution)**:描述事件发生间隔的分布,常用于排队论和可靠性分析。
3. **贝叶斯统计(Bayesian Statistics)** 贝叶斯统计使用贝叶斯定理来更新概率估计。
- **贝叶斯定理(Bayes' Theorem)**:通过已知条件概率来计算未知事件的条件概率。
- **先验分布(Prior Distribution)**:在观察数据之前的假设分布。
- **后验分布(Posterior Distribution)**:观察数据后,更新的概率分布。
4. **假设检验(Hypothesis Testing)** 用于根据样本数据推断总体特征,判断假设是否成立。
- **零假设(Null Hypothesis)**:假设没有差异或关系。
- **备择假设(Alternative Hypothesis)**:假设存在差异或关系。
- **t检验(t-test)**:用于比较两个样本均值之间的差异。
- **卡方检验(Chi-square Test)**:用于检验分类数据是否符合某一分布或不同变量之间的独立性。
- **p值(p-value)**:用于衡量样本数据与零假设的一致性,若 p 值小于显著性水平(如 0.05),通常拒绝零假设。
5. **回归分析(Regression Analysis)** 回归分析用于研究自变量与因变量之间的关系。
- **线性回归(Linear Regression)**:通过拟合直线来描述因变量与一个或多个自变量之间的关系。
- **多元回归(Multiple Regression)**:分析多个自变量对因变量的影响。
- **逻辑回归(Logistic Regression)**:用于处理分类问题,预测某一事件的发生概率。
6. **马尔科夫链(Markov Chains)** 马尔科夫链是一种随机过程,其中下一个状态仅与当前状态有关,与之前的状态无关。广泛应用于各种领域,如排队论、游戏理论等。
7. **蒙特卡罗方法(Monte Carlo Methods)** 蒙特卡罗方法通过随机抽样来模拟和求解复杂的概率问题,常用于无法直接计算解析解的问题,如金融模型、物理模拟等。
8. **协方差与相关性(Covariance and Correlation)**
- **协方差(Covariance)**:衡量两个变量之间是否存在线性关系,符号可以告诉我们它们的关系是正相关还是负相关。
- **相关系数(Correlation)**:标准化的协方差,表示两个变量之间关系的强度和方向,常用皮尔逊相关系数(Pearson Correlation)。
9. **抽样方法(Sampling Methods)** 抽样方法用于从总体中选取一个代表性样本,常见的有:
- **简单随机抽样(Simple Random Sampling)**:每个个体被选中的概率相等。
- **分层抽样(Stratified Sampling)**:将总体划分为不同的层次,分别从每个层次中抽样。
- **系统抽样(Systematic Sampling)**:按一定规则从总体中选取样本。
10. **置信区间(Confidence Interval)** 置信区间用于估计总体参数的范围。例如,95% 置信区间表示在多次实验中,95% 的样本会包含真实的总体参数。
# Ref.
- https://readwise.io/reader/shared/01jmx4f75w00wbgx775yc7kr62
- https://readwise.io/reader/shared/01jrprt16e1xmpe5k9za3j0dtd