Deep Learning 深度学习 - 朱婉妤的知识库

- Objective: - Breadcrumb: 人工神经网络 - 深度学习 - [ ] [[Backpropagation 反向传播算法]] # 概念阐释 - **定义**： - 深度学习是[[machine learning 机器学习]]的一个子领域，指的是通过多层次的[[ANN 人工神经网络]]为架构，进行[[特征学习 Feature learning]]和[[模式识别 Pattern Recognition]]的算法。 - **核心**： - 深度学习的核心是“[[Deep Learning 深度学习|深度神经网络DNN]]，其特点是包含多个隐藏层，这些层能够逐步提取数据中的高层次特征。 - **与传统的机器学习的区别**： - 如决策树、支持向量机不同，深度学习模型通过自动化学习数据的多层次特征表达，能够处理复杂的非线性关系。 - 深度学习主要影响的领域有： - 图像识别 - 图像生成 - 语音识别 - 语言翻译 - 自动驾驶 - 自然语言处理 - 医疗健康 # 实例 - [[MLP 多层感知器]] - [[CNN 卷积神经网络]] - [[Transformer]] - [[RNN 循环神经网络]] # 相关内容 ## 为什么深度学习有效？ - 大数据、大模型、大算力 [[algorithm 算法]]会迭代调整内部的参数，以最大程度地减少预测与实际结果之间的错误，最直观的机器学习模型是[[Liner Regression 线性回归]]，目的是通过调节 2 个[[parameters 参数]]找出一条最拟合这些数据的直线。在 GPT-3 里，这样的参数有 1750 亿个。但是仅仅有庞大的参数并不能让模型有效的工作，单纯的调节参数会出现模型[[overfitting 过度拟合]]的问题，而[[Deep Learning 深度学习]]却解决了这一问题，方法是通过[[Backpropagation 反向传播算法]]。 ![200](https://image.harryrou.wiki/2024-10-18-CleanShot%202024-10-18%20at%2014.34.50%402x.png) ## 神经网络与深度学习的区别 1. **神经网络** 是一个具体的技术概念，指的是一种模拟生物神经网络行为的数学模型或算法。它可以是简单的单层[[perceptron 感知器|感知机]]，也可以是更复杂的多层网络。 2. **深度学习** 是神经网络的一个子领域，通常指利用 **深层神经网络（Deep Neural Networks, DNNs）** 进行学习和建模。深度学习的核心在于神经网络的层数较多（深度），因此能够从复杂和高维的数据中提取出更抽象的特征。 ### 区别点深度学习的内涵不仅限于使用神经网络，还包括以下几个层面： - 数据预处理和增强 - 特征提取和表示 - 优化算法（如梯度下降、Adam 等） - 模型的训练和评估策略 - 分布式计算和硬件支持 **总结**：神经网络是深度学习的核心工具，而深度学习则是一个更广义的范畴，强调将大数据、大模型和大算力结合起来，从而解决复杂的人工智能问题。 ## 人工神经网络的逆袭之旅关联记忆 PDP平行分布式处理，连接主义、感知机、神经网络的另一种说法卷积网络深度学习神经网络学习观[[ANN 人工神经网络]]兴起于上世纪 80 年代，当时叫做「并行分布式理论parallel distributed processing」简称「连接主义」。当时没人敢叫神经网络理论，研究“神经”的学者在当时要么被看作是骗子，要么被看作是疯子。2007 年，hinton 对这一领域进行了重新塑造，改名为「深度学习 Deep Learning」，2012 年[[AlexNet]]成为深度学习的爆发时刻，2022年 11 月末 ChatGPT发布，带来了一场「深度学习革命」。 ## 类比于人类学习 - 人类大脑擅长的学习方式也是先进行[[特征学习 Feature learning]]，再进行[[模式识别 Pattern Recognition]]。 # 参考资料 - [深度学习 - Wikipedia](https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0)