考试目标是测试考生全面和深入地掌握统计学习的基本概念和原理,了解统计学习领域中常用的算法、前沿研究内容、以及统计学习在大数据时代处理各类大数据中的应用。矚慫润厲钐瘗睞枥庑赖賃軔朧。 II.考试形式和试卷结构 一、试卷总分及考试时间
试卷总分为100分,考试时间180分钟。 二、答题方式
答题方式为闭卷、笔试。 III.考查内容 第一章 线性回归 2.1一元线性回归 2.1.1 估计系数
2.1.2 评估参数的准确性 2.1.3 评估模型的精度 2.2 多元线性回归 2.2.1 估计回归系数
2.2.2 评估模型的精度与参数的准确性 2.2.3 非线性回归 第二章 分类方法 3.1 Logistic回归 3.1.1 Logistic模型 3.1.2 估计回归系数
3.1.3 大于两类的Logistic回归 3.2 判别分析
3.2.1 Bayes 定理
3.2.2 p=1时的线性判别分析 3.2.3 p>1时的线性判别分析 3.2.4 二次判别分析 第三章 重抽样方法 4.1 交叉验证
4.1.1 Leave-one-out交叉验证 4.1.2 K组交叉验证
4.1.3 交叉验证与预测问题 4.2 Bootstrap
第四章 模型选择及规则化 5.1 子集选择
5.1.1 最佳子集选择 5.1.2 逐步选择 5.1.3 选择最优模型 5.2 Ridge回归与LASSO 5.2.1 Ridge回归 5.2.2 LASSO
1 / 2
5.3 降维方法
5.3.1 主成分回归 5.3.2 偏最小二乘 第五章 基于树的方法 6.1 决策树 6.1.1 回归树 6.1.2 分类树 6.2随机森林 6.2.1 Bagging 6.2.2 随机森林 6.2.3 Boosting
第六章 支撑向量机 7.1 最大边缘分类 7.1.1 超平面
7.1.2 基于分隔超平面的分类 7.1.3 最大边缘分类 7.2 支撑向量分类 7.2.1 支撑向量
7.2.2 基于非线性决策边缘的分类 7.3 支撑向量多分类 7.3.1 一对一分类 7.3.2 一对多分类
第七章 深度学习简介 8.1 BP神经网络 8.1.1 神经网络的架构 8.1.2 反向传播算法 8.2 卷积神经网络 8.2.1 卷积层
8.2.2 ReLU 和Pooling 处理 IV主要参考书籍
[1] Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. An Introduction to Statistical Learningwith application in R. NewYork: Springer,2013.聞創沟燴鐺險爱氇谴净祸測樅。 [2] Vapnik,V. Statistical Learning Theory.John Wiley and Sons,Inc.,1998.残骛楼諍锩瀨濟溆塹籟婭骒東。 [3] Richard J. Roiger, Michael W. Geatz 著, 翁敬农 译,数据挖掘教程. 北京: 清华大学出版社,2003.酽锕极額閉镇桧猪訣锥顧荭钯。 2 / 2
因篇幅问题不能全部显示,请点此查看更多更全内容