- Objective: 人为提取特征 - Breadcrumb: 传统机器学习 # 概念阐释 - 特征工程 (feature engineering)是[[machine learning 机器学习]]中一项重要的工作,指的是人类从原始数据中提取、转换或创建对模型训练**更有意义的特征**(Feature)。这些特征能够帮助模型更好地识别模式、进行分类或预测。简而言之,帮助机器更好的理解数据。 # 实例 - 对于传统机器学习(如决策树、逻辑回归、[[SVM 支持向量机]])而言,经过良好设计的特征往往能够显著提升模型效果。 - 对图像做一些形状、纹理的统计; - 对时间序列做移动平均、差分; - 对业务数据组合多个原字段得到更能体现业务逻辑的新特征; - 对文本进行分词、提取 n-gram 等。 # 相关内容 ## 特征工程与深度学习 - 在传统机器学习产品的特点是**人工[[特征工程 Feature Engineering]]** 占主导地位。例如,图像识别系统需要手动提取边缘和形状**特征**;随着[[Deep Learning 深度学习|深度学习]]的普及,这些应用逐渐转向自动化的[[端到端]]的方法,例如使用[[CNN 卷积神经网络]]进行[[特征学习 Feature learning]],最终达到图像识别的目的,或使用 [[Transformer]]模型处理自然语言任务。 # 参考资料