- Objective: - Breadcrumb: 人工神经网络 - 深度学习 - [ ] [[Backpropagation 反向传播算法]] # 概念阐释 - **定义**: - 深度学习是[[machine learning 机器学习]]的一个子领域,指的是通过多层次的[[ANN 人工神经网络]]为架构,进行[[特征学习 Feature learning]]和[[模式识别 Pattern Recognition]]的算法。 - **核心**: - 深度学习的核心是“[[Deep Learning 深度学习|深度神经网络DNN]],其特点是包含多个隐藏层,这些层能够逐步提取数据中的高层次特征。 - **与传统的机器学习的区别**: - 如决策树、支持向量机不同,深度学习模型通过自动化学习数据的多层次特征表达,能够处理复杂的非线性关系。 - 深度学习主要影响的领域有: - 图像识别 - 图像生成 - 语音识别 - 语言翻译 - 自动驾驶 - 自然语言处理 - 医疗健康 # 实例 - [[MLP 多层感知器]] - [[CNN 卷积神经网络]] - [[Transformer]] - [[RNN 循环神经网络]] # 相关内容 ## 为什么深度学习有效? - 大数据、大模型、大算力 [[algorithm 算法]]会迭代调整内部的参数,以最大程度地减少预测与实际结果之间的错误,最直观的机器学习模型是[[Liner Regression 线性回归]],目的是通过调节 2 个[[parameters 参数]]找出一条最拟合这些数据的直线。在 GPT-3 里,这样的参数有 1750 亿个。但是仅仅有庞大的参数并不能让模型有效的工作,单纯的调节参数会出现模型[[overfitting 过度拟合]]的问题,而[[Deep Learning 深度学习]]却解决了这一问题,方法是通过[[Backpropagation 反向传播算法]]。 ![200](https://image.harryrou.wiki/2024-10-18-CleanShot%202024-10-18%20at%2014.34.50%402x.png) ## 神经网络与深度学习的区别 1. **神经网络** 是一个具体的技术概念,指的是一种模拟生物神经网络行为的数学模型或算法。它可以是简单的单层[[perceptron 感知器|感知机]],也可以是更复杂的多层网络。 2. **深度学习** 是神经网络的一个子领域,通常指利用 **深层神经网络(Deep Neural Networks, DNNs)** 进行学习和建模。深度学习的核心在于神经网络的层数较多(深度),因此能够从复杂和高维的数据中提取出更抽象的特征。 ### 区别点 深度学习的内涵不仅限于使用神经网络,还包括以下几个层面: - 数据预处理和增强 - 特征提取和表示 - 优化算法(如梯度下降、Adam 等) - 模型的训练和评估策略 - 分布式计算和硬件支持 **总结**: 神经网络是深度学习的核心工具,而深度学习则是一个更广义的范畴,强调将大数据、大模型和大算力结合起来,从而解决复杂的人工智能问题。 ## 人工神经网络的逆袭之旅 关联记忆 PDP平行分布式处理,连接主义、感知机、神经网络的另一种说法 卷积网络 深度学习 神经网络学习观[[ANN 人工神经网络]]兴起于上世纪 80 年代,当时叫做「并行分布式理论parallel distributed processing」简称「连接主义」。当时没人敢叫神经网络理论,研究“神经”的学者在当时要么被看作是骗子,要么被看作是疯子。2007 年,hinton 对这一领域进行了重新塑造,改名为「深度学习 Deep Learning」,2012 年[[AlexNet]]成为深度学习的爆发时刻,2022年 11 月末 ChatGPT发布,带来了一场「深度学习革命」。 ## 类比于人类学习 - 人类大脑擅长的学习方式也是先进行[[特征学习 Feature learning]],再进行[[模式识别 Pattern Recognition]]。 # 参考资料 - [深度学习 - Wikipedia](https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0)