- Objective: 人为提取特征
- Breadcrumb: 传统机器学习
# 概念阐释
- 特征工程 (feature engineering)是[[machine learning 机器学习]]中一项重要的工作,指的是人类从原始数据中提取、转换或创建对模型训练**更有意义的特征**(Feature)。这些特征能够帮助模型更好地识别模式、进行分类或预测。简而言之,帮助机器更好的理解数据。
# 实例
- 对于传统机器学习(如决策树、逻辑回归、[[SVM 支持向量机]])而言,经过良好设计的特征往往能够显著提升模型效果。
- 对图像做一些形状、纹理的统计;
- 对时间序列做移动平均、差分;
- 对业务数据组合多个原字段得到更能体现业务逻辑的新特征;
- 对文本进行分词、提取 n-gram 等。
# 相关内容
## 特征工程与深度学习
- 在传统机器学习产品的特点是**人工[[特征工程 Feature Engineering]]** 占主导地位。例如,图像识别系统需要手动提取边缘和形状**特征**;随着[[Deep Learning 深度学习|深度学习]]的普及,这些应用逐渐转向自动化的[[端到端]]的方法,例如使用[[CNN 卷积神经网络]]进行[[特征学习 Feature learning]],最终达到图像识别的目的,或使用 [[Transformer]]模型处理自然语言任务。
# 参考资料