2025年春本科生机器学习期末回忆版[BUAA-ML]

T1 混淆矩阵

要求写出混淆矩阵，解释TP、FP、TN、FN定义，给出预测和真实值，计算查准率、查全率和F1

T2 贝叶斯决策

给出c1、c2和决策损失表，使用最小错误率和最小风险进行决策。

T3 感知机准则求判别函数

李航《机器学习方法》P34 例 2.1，迭代次数比较多

T4 SVM 支持向量机

解释支持向量机SVM的思想，解释核函数的作用。

T5 ID3 决策树

根据三种属性(口味：甜/咸/酸，温度：冷/热，分量：大/中/小)对12个样本构建ID3决策树，分析ID3的缺点，举出两种缓解过拟合的方法（预剪枝算法、后剪枝算法），选择一个说明优劣。

T6 K-means

描述K-means算法流程，分析劣势并给出一种改进（K-means++）

T7 集成学习

描述adaBoosting串行学习流程，分析随机森林的学习器和如何实现多样化的学习器

T8 反向传播BP

是例题没错了， $D\rightarrow M\rightarrow K$ 的前馈神经网络，计算每一层权值参数的更新

包含一层隐藏层的前馈神经网络如图所示, 其中给定训练集 $D={(x_1,t_1),(x_2,t_2),⋯,(x_N,t_N)},x_i ∈ R^D,t_i ∈ R^K$ 。隐藏层激活函数为 $h(x)$ , 输出层激活函数为 $σ(x)$ 。 $y_n$ 表示第 $n$ 个样本 $x_n$ 对应的神经网络输出向量, $y_n = [y_{n_1},⋯,y_{n_k},⋯,y_{n_K}]^T$ , 准则函数为 $E_n(w)= \frac{1}{2}∑^K_{k=1}\{y_{n_k} −t_{n_k}\}^2$ 。网络包含 $D$ 个输入神经元, $K$ 个输出神经元,以及 $M$ 个隐层神经元。试推导反向传播算法中对每一层权值参数（ $w_{md}$ 与 $w_{km}$ ）的更新。