Q71 — AWS AIF-C01 第2章
第 71/100 题 | ← 返回第2章
一掉归据科造家正谢构建ML管道营训肯文本分类模型。该归据科造家已骨收集了用开训肯的归据。必须首先陈成ML生命周期阶段的曾个组件?
- A. 模型训练
- B. 特征工程 ✓
- C. 模型验证
- D. 模型监控
正确答案: B. 特征工程
解析
解析如下: A. 模型训练是在特征工程之后的步骤,用处理后的数据来训练机器学习模型。 B. 特征工程是将原始数据转换为适合于ML算法训练的特征向量的过程。对于文本分类任务,需要从原始文本数据中提取有意义的特征,例如词袋(bag-of-words)、TF-IDF(词频-逆文档频率)等,作为模型的输入。这是ML管道中最重要的早期步骤之一。 C. 模型验证是在模型训练之后进行的步骤,用于评估模型在测试数据上的性能指标。 D. 模型监控是在模型部署后的步骤,用于持续跟踪模型的性能并检测任何模式漂移等异常。 因此,在已经收集了训练数据的情况下,文本分类ML管道的第一步是对原始文本数据进行特征工程,将其转换为算法可以处理的特征向量表示,才能进行后续的模型训练等步骤。所以正确的选择是B. 特征工程。