机器学习概论及模型评估1.机器学习基本概念;2.基本术语;3.假设空间;掌握机器学习的基本概念,掌握模型的评144.归纳偏好:估方法,了解假设空间和归纳偏好。5.经验误差与过拟合;6.评估方法;7.性能度量。决策树1.基本概念;掌握决策树基本原理、算法,了解不同的2.基本流程;决策树模型,掌握剪枝处理办法,能够利423.决策树算法:ID3、C4.5、CART、用决策树知识处理实际问题。随机森林;4.决策树学习的常见间题(过度拟合)和处理方法(修剪)。贝叶斯学习1.贝叶斯的基本原理;2.MAP假设和一致学习器;掌握贝叶斯学习方法,了解极大似然估计33.极大似然和最小误差平方假设方法,掌握朴素贝叶斯分类器,能够应用4原理;贝叶斯方法解决实际问题。4.最优分类器原理和算法5.EM算法的原理和实现。人工神经网络掌握误差反向传播算法,掌握BP、RBF、1.神经元模型;GRNN等神经网络模型以及参数的设置;掌2.感知机与多层网络;4握CNN网络,熟悉其他深度学习网络,能43.误差反向传播算法;够利用神经网络以及深度学习方法解决实4.全局最小与局部极小;际间题。5.深度学习。数据挖掘概述1.概念描述:定性与对比;2.关联分析;掌握数据挖掘中的关联分析、聚类分析、523.分类与预测;分类与预测等基本概念。4.聚类分析;5.异类分析;24
24 1 机器学习概论及模型评估 1. 机器学习基本概念; 2. 基本术语; 3. 假设空间; 4. 归纳偏好; 5. 经验误差与过拟合; 6. 评估方法; 7. 性能度量。 掌握机器学习的基本概念,掌握模型的评 估方法,了解假设空间和归纳偏好。 4 2 决策树 1. 基本概念; 2. 基本流程; 3. 决策树算法:ID3、C4.5、CART、 随机森林; 4. 决策树学习的常见问题(过度 拟合)和处理方法(修剪)。 掌握决策树基本原理、算法,了解不同的 决策树模型,掌握剪枝处理办法,能够利 用决策树知识处理实际问题。 4 3 贝叶斯学习 1. 贝叶斯的基本原理; 2. MAP 假设和一致学习器; 3. 极大似然和最小误差平方假设 原理; 4. 最优分类器原理和算法; 5. EM 算法的原理和实现。 掌握贝叶斯学习方法,了解极大似然估计 方法,掌握朴素贝叶斯分类器,能够应用 贝叶斯方法解决实际问题。 4 4 人工神经网络 1. 神经元模型; 2. 感知机与多层网络; 3. 误差反向传播算法; 4. 全局最小与局部极小; 5. 深度学习。 掌握误差反向传播算法,掌握 BP、RBF、 GRNN 等神经网络模型以及参数的设置;掌 握 CNN 网络,熟悉其他深度学习网络,能 够利用神经网络以及深度学习方法解决实 际问题。 4 5 数据挖掘概述 1. 概念描述:定性与对比; 2. 关联分析; 3. 分类与预测; 4. 聚类分析; 5. 异类分析; 掌握数据挖掘中的关联分析、聚类分析、 分类与预测等基本概念。 2
6.演化分析。数据预处理1.噪声数据处理;掌握数据预处理方法,会进行噪声处理62.不一致数据处理;4不一致处理、集成处理、转换处理。3.数据集成处理:4.数据转换处理。分类与预测1.基于决策树的分类;掌握决策树、贝叶斯、神经网络等基本的2.贝叶斯分类;76分类方法以及线性和非线性回归预测方3.神经网络分类;法,能够对实际间题进行分类或者预测。4.线性回归;5.非线性回归。聚类分析与数据降维1.K-MEANS算法;掌握K-MeanS、DBSCAN、模糊聚类方法以2.DBSCAN算法;8及主成分分析方法,能够对实际间题中的3.模糊聚类算法;数据进行聚类或者降维处理。4.半监督学习;5.主成分分析。实验部分必开/实验学实验内容、要求及时间安排、仪馨要序号实验项目名称时求选开类型三、教学方法以“课堂讲授+课堂讨论”为主要教学方法,通过讲解基础内容、查阅并研读前沿论文、研讨实际问题,结合仿真或者实验实践,切实提高学生的科研能力。四、课程思政内容1.培养学生的数据思维的科研范式,通过数据来发现间题、分析问题和解决问题。在课程中,注重引入多种方式进行问题分析,对比经验逻辑的解题方式和依靠数据形成结论之间的差异,培养学生适应新的科研方法。2.通过讲解数据预处理的方法,跟学生重点强调所有科研数据都应该是真实的,在发表论文时,要尊重实验结果,而不能进行数据篡改、图表造假等,培养学生正确的科学态度。25
25 6. 演化分析。 6 数据预处理 1. 噪声数据处理; 2. 不一致数据处理; 3. 数据集成处理; 4. 数据转换处理。 掌握数据预处理方法,会进行噪声处理、 不一致处理、集成处理、转换处理。 4 7 分类与预测 1. 基于决策树的分类; 2. 贝叶斯分类; 3. 神经网络分类; 4. 线性回归; 5. 非线性回归。 掌握决策树、贝叶斯、神经网络等基本的 分类方法以及线性和非线性回归预测方 法,能够对实际问题进行分类或者预测。 6 8 聚类分析与数据降维 1. K-MEANS 算法; 2. DBSCAN 算法; 3. 模糊聚类算法; 4. 半监督学习; 5. 主成分分析。 掌握 K-Means、DBSCAN、模糊聚类方法以 及主成分分析方法,能够对实际问题中的 数据进行聚类或者降维处理。 4 实验部分 序号 实验项目名称 学 时 实验内容、要求及时间安排、仪器要 求 必开/ 选开 实验 类型 三、教学方法 以“课堂讲授+课堂讨论”为主要教学方法,通过讲解基础内容、查阅并研读前沿论文、 研讨实际问题,结合仿真或者实验实践,切实提高学生的科研能力。 四、课程思政内容 1. 培养学生的数据思维的科研范式,通过数据来发现问题、分析问题和解决问题。在 课程中,注重引入多种方式进行问题分析,对比经验逻辑的解题方式和依靠数据形成结论之 间的差异,培养学生适应新的科研方法。 2. 通过讲解数据预处理的方法,跟学生重点强调所有科研数据都应该是真实的,在发 表论文时,要尊重实验结果,而不能进行数据篡改、图表造假等,培养学生正确的科学态度
五、教学目标达成与评价方式1.教学目标“了解机器学习和数据挖掘领域的最新发展动向及现状”通过授课与研读科研论文达成,达成情况通过课堂表现评价:2.教学目标“掌握机器学习和数据挖掘的新概念、新理论、新方法与技术及其应用情况”通过授课、研读科研论文及小测验达成,达成情况通过课堂讨论回答问题情况、小测验完成情况进行评价;3.教学目标“掌握一些基本的算法实现,能够运用机器学习和数据挖掘方法来解决实际问题,培养学生分析问题、解决问题的能力”通过授课、研读科研论文及作业和期末论文达成,达成情况通过课堂表现及大作业答辩完成情况进行评价。六、课程成绩评定总成绩=出勤/讨论问题表现/小测验20%+作业及答辩30%+论文50%七、建议教材与主要参考书建议教材:《机器学习》周志华.清华大学出版社,2016年参考书:1《数据挖掘:概念与技术》JiaweiHan,MichelineKamber.机械工业出版社,2007年2.《数据挖掘导论》范明,范红建.人民邮电出版社,2006年3.《MATLAB与机器学习》MichaelPaluszek.机械工业出版社,2018年,4.《机器学习经典算法实践》肖云鹏,卢星宇,许明.清华大学出版社,2018年八、编制与审核工作内容负责人完成时间王丽婕2024年8月16日编制(任课教师)审核(学科、专业负范军芳2024年8月16日责人)刘宁批准(主管院长)2024年8月16日26
26 五、教学目标达成与评价方式 1. 教学目标“了解机器学习和数据挖掘领域的最新发展动向及现状”通过授课与研读 科研论文达成,达成情况通过课堂表现评价; 2.教学目标“掌握机器学习和数据挖掘的新概念、新理论、新方法与技术及其应用情 况”通过授课、研读科研论文及小测验达成,达成情况通过课堂讨论回答问题情况、小测验 完成情况进行评价; 3. 教学目标“掌握一些基本的算法实现,能够运用机器学习和数据挖掘方法来解决实 际问题,培养学生分析问题、解决问题的能力”通过授课、研读科研论文及作业和期末论文 达成,达成情况通过课堂表现及大作业答辩完成情况进行评价。 六、课程成绩评定 总成绩=出勤/讨论问题表现/小测验 20%+作业及答辩 30%+论文 50% 七、建议教材与主要参考书 建议教材: 《机器学习》周志华. 清华大学出版社,2016 年 参考书: 1. 《数据挖掘:概念与技术》Jiawei Han,Micheline Kamber. 机械工业出版社,2007 年 2. 《数据挖掘导论》范明,范红建. 人民邮电出版社,2006 年 3. 《MATLAB 与机器学习》Michael Paluszek. 机械工业出版社,2018 年. 4. 《机器学习经典算法实践》肖云鹏,卢星宇,许明. 清华大学出版社,2018 年 八、编制与审核 工作内容 负责人 完成时间 编制(任课教师) 王丽婕 2024 年 8 月 16 日 审核(学科、专业负 责人) 范军芳 2024 年 8 月 16 日 批准(主管院长) 刘宁 2024 年 8 月 16 日
《模式识别》课程教学大纲课程名称模式识别课程编码ISE505英文名称Pattern Recognition考核方式口考试口考查公共必修课学分2回专业必修课口公共选修课课程性质口专业选修课32总学时口补修课口其他口本研一体化课程口特色课程口学科交叉融合课程口全英文授课课程12课程特点实验学时口双语授课课程口案例课程口校企联合课程其他-先修课程(已具概率论与数理统计高等数学线性代数C语言程序设计或python程序设计备知识能力)适用学科/专业控制科学与工程/学术型硕士;电子信息(控制工程、人工智能)/专业型硕士学位类别(领域)一、课程教学目标(说明:根据培养目标,紧密结合本课程特性与内涵,概括性的确定出学习者学习该课程后,在知识、科研实践能力和创新能力等方面应达到的目标与要求。)学生通过《模式识别》课程的学习,能够掌握模式识别的基本理论和基础知识,熟悉模式识别系统的设计与构造,具有应用模式识别理论解决生产和生活实际间题的初步技能。在知识层面,学习并掌握贝叶斯决策、特征提取与降维分析、分类器设计(包括线性、非线性)、模式识别系统定性和定量评价。在此基础上,能够自主阅读和分析该领域的中英文学术文献,应用于项目或课题任务中解决问题。能够及时总结分析,并撰写相关的学术论文发表。二、课程教学内容提要与基本要求理论部分序号学时教学内容提要基本要求27
27 《模式识别》课程教学大纲 课程名称 模式识别 课程编码 ISE505 英文名称 Pattern Recognition 考核方式 □考试 考查 课程性质 □公共必修课 专业必修课 □公共选修课 专业选修课 □补修课 □其他_ 学分 2 总学时 32 课程特点 □本研一体化课程 □特色课程 □学科交叉融合课程 □全英文授课课程 □双语授课课程 □案例课程 □校企联合课程 其他_ 实验学时 12 先修课程(已具 备知识能力) 概率论与数理统计 高等数学 线性代数 C 语言程序设计或 python 程序设计 适用学科/专业 学位类别(领域) 控制科学与工程/学术型硕士;电子信息(控制工程、人工智能)/专业型硕士 一、课程教学目标 (说明:根据培养目标,紧密结合本课程特性与内涵,概括性的确定出学习者学习该课 程后,在知识、科研实践能力和创新能力等方面应达到的目标与要求。) 学生通过《模式识别》课程的学习,能够掌握模式识别的基本理论和基础知识,熟悉模 式识别系统的设计与构造,具有应用模式识别理论解决生产和生活实际问题的初步技能。在 知识层面,学习并掌握贝叶斯决策、特征提取与降维分析、分类器设计(包括线性、非线性)、 模式识别系统定性和定量评价。在此基础上,能够自主阅读和分析该领域的中英文学术文献, 应用于项目或课题任务中解决问题。能够及时总结分析,并撰写相关的学术论文发表。 二、课程教学内容提要与基本要求 理论部分 序号 教学内容提要 基本要求 学时
了解2模式识别绪论、概况贝叶斯决策(含最小错误概率Bayes决策,最小风险Bayes决2策,Bayes分类器和判别函数,概率密度函数的参数和非参数掌握4估计)线性分类器设计(含准则函数定义、线性判别函数和决策面,掌握33感知准则函数和梯度下降法,固定增量算法及其收敛性,最小平方误差准则函数,支持向量机)3掌握4非线性分类器设计(分段线性函数、BP网络、核支持向量机)25理解其他分类器设计(距离函数设计、Adaboost算法、决策树)理解26特征提取与降维(离散K-L变换、主成分分析、深度学习概述72理解模式识别系统设计(实际案例分析)28理解模式识别系统评价实验部分必开/实验实验内容、要求及时间安排、仪器要学序号实验项目名称求时选开类型实验内容:了解并熟悉多种特征及其计算方法(Harris角点、尺度不变特征变化SIFT特征、SURF特征),并对特征向量有直观的分析和可视化展验证示。1特征提取与分析必开型要求:基于matlab或python语言独立编写程序时间安排:课外3小时仪器要求:计算机实验内容:提取合适特征,运用支持向量机对给定目标进行分类。设计基于支持向量机的目标要求:基于matlab或python语言独2必开检测型立编写程序时间安排:课外3小时仪器要求:计算机设计基于深度神经网络的目实验内容:采用多个深度神经网络对必开3型标检测给定目标进行分类。28
28 1 模式识别绪论、概况 了解 2 2 贝叶斯决策(含最小错误概率 Bayes 决策,最小风险 Bayes 决 策, Bayes 分类器和判别函数,概率密度函数的参数和非参数 估计) 掌握 4 3 线性分类器设计(含准则函数定义、线性判别函数和决策面, 感知准则函数和梯度下降法,固定增量算法及其收敛性,最小 平方误差准则函数,支持向量机)。 掌握 3 4 非线性分类器设计(分段线性函数、BP 网络、核支持向量机) 掌握 3 5 其他分类器设计(距离函数设计、Adaboost 算法、决策树) 理解 2 6 特征提取与降维(离散 K-L 变换、主成分分析、深度学习概述) 理解 2 7 模式识别系统设计(实际案例分析) 理解 2 8 模式识别系统评价 理解 2 实验部分 序号 实验项目名称 学 时 实验内容、要求及时间安排、仪器要 求 必开/ 选开 实验 类型 1 特征提取与分析 4 实验内容:了解并熟悉多种特征及其 计算方法(Harris 角点、尺度不变特 征变化 SIFT 特征、SURF 特征),并对 特征向量有直观的分析和可视化展 示。 要求:基于 matlab 或 python 语言独 立编写程序 时间安排:课外 3 小时 仪器要求:计算机 必开 验证 型 2 基于支持向量机的目标 检测 4 实验内容:提取合适特征,运用支持 向量机对给定目标进行分类。 要求:基于 matlab 或 python 语言独 立编写程序 时间安排:课外 3 小时 仪器要求:计算机 必开 设计 型 3 基于深度神经网络的目 标检测 4 实验内容:采用多个深度神经网络对 给定目标进行分类。 必开 设计 型