T1 混淆矩阵

要求写出混淆矩阵,解释TP、FP、TN、FN定义,给出预测和真实值,计算查准率、查全率和F1

T2 贝叶斯决策

给出c1、c2和决策损失表,使用最小错误率和最小风险进行决策。

T3 感知机准则求判别函数

李航《机器学习方法》P34 例 2.1,迭代次数比较多

T4 SVM 支持向量机

解释支持向量机SVM的思想,解释核函数的作用。

T5 ID3 决策树

根据三种属性(口味:甜/咸/酸,温度:冷/热,分量:大/中/小)对12个样本构建ID3决策树,分析ID3的缺点,举出两种缓解过拟合的方法(预剪枝算法、后剪枝算法),选择一个说明优劣。

T6 K-means

描述K-means算法流程,分析劣势并给出一种改进(K-means++)

T7 集成学习

描述adaBoosting串行学习流程,分析随机森林的学习器和如何实现多样化的学习器

T8 反向传播BP

是例题没错了,DMKD\rightarrow M\rightarrow K的前馈神经网络,计算每一层权值参数的更新

包含一层隐藏层的前馈神经网络如图所示, 其中给定训练集 D=(x1,t1),(x2,t2),,(xN,tN),xiRD,tiRKD={(x_1,t_1),(x_2,t_2),⋯,(x_N,t_N)},x_i ∈ R^D,t_i ∈ R^K。隐藏层激活函数为 h(x)h(x), 输出层激活函数为σ(x)σ(x)yny_n表示第 nn 个样本 xnx_n 对应的神经网络输出向量,yn=[yn1,,ynk,,ynK]Ty_n = [y_{n_1},⋯,y_{n_k},⋯,y_{n_K}]^T, 准则函数为 En(w)=12k=1K{ynktnk}2E_n(w)= \frac{1}{2}∑^K_{k=1}\{y_{n_k} −t_{n_k}\}^2 。网络包含DD个输入神经元, KK个输出神经元,以及MM个隐层神经元。试推导反向传播算法中对每一层权值参数(wmdw_{md}wkmw_{km})的更新。
T8

T9 开放性试题

文生视频用到了什么技术,可能的挑战和潜在问题。