一、课程基本信息
课程编号:
课程名称:大数据分析与挖掘 英文名称: 课程学时: 48 课程学分:3
开课单位:计算机科学与技术学院
授课对象:计算机科学与技术专业,计算机大类专业 开课学期: 先修课程:
二、课程目标
数据挖掘是一门新兴的交叉性学科,涵盖了数据库、机器学习、统计学、模式识别、人工智能以及高性能计算等技术。开设本课程的目的,是使学生全面而深入地掌握数据挖掘的基本概念和原理,掌握常用的数据挖掘算法,了解数据挖掘的最新发展、前沿的数据挖掘研究领域、以及数据挖掘技术在不同学科中的应用。课程具体目标如下:
课程目标1: 能够设计并实现大数据平台下的数据挖掘系统。了解由工程问题,到建模、再到
数据挖掘算法设计的问题求解思维模式。具有将数据挖掘算法应用于具体工程的能力;
课程目标2: 掌握大数据预处理、关联规则、分类以及聚类技术,并能够在主流大数据平台上
实现;
课程目标3: 具备较强的学习最新数据挖掘领域研究成果的能力;能够分析和评价现有研究成
果的问题与不足,并能够提出自己独立见解的能力;
课程目标4: 能够撰写系统设计方案和阶段性技术报告,能够组织和协调项目组的工作,与成
员进行交流与沟通。
三、课程目标与毕业要求对应关系
毕业要求 工程素质 毕业要求具体描述 (1)具有工程意识和系统观;(2)具有运用工程基础和专业知识解决复杂工程问题的能力 (1)具有自主学习、终身学习和跟踪前沿的意识和习惯。 (2)具有批判精神,对待事物有独立见解。 课程目标 课程目标1 个性素质 课程目标3、4 毕业要求 毕业要求具体描述 (1)针对计算相关的复杂工程问题,能够综合运用所掌握的计算机类相关知识、方法和技术,进行问题分析与模型表达。 (2)能够领导或独立设计解决方案或满足特定需求的计算机硬件、软件或网络系统,并能够实现相关系统或组件。 针对计算相关的复杂工程问题解决方案或系统,能够综合运用所掌握的计算机类相关知识、方法和技术,设计实验,进行分析和评价,包含其对社会、健康、安全、法律以及文化的影响分析和评价,并能够提出持续改进的意见和建议。 (1) 理解并掌握工程管理原理与经济决策方法,并能在多学科环境中应用。 (2) 具备较强的组织协调或项目管理能力、独立工作能力、团队协作能力和人际交往能力。 课程目标 系统设计与实现能力 课程目标1、2 系统分析和评价能力 课程目标3 组织/协调与项目管理能力 课程目标4 四、课程目标与课程内容对应关系
序号 教学内容 教学要求 了解数据挖掘的概念及其发展过程,在各行业中的典型应用,以及数据挖掘的过程。 学时 教学方式 大班讲授 对应课程 目标 课程目标1、3 1 数据挖掘概述 数据特征分析与预处理 2.1 数据的类型 2.2 数据的统计特征 2.3 数据预处理 2.4 缺失值的处理 2.5 数据可视化 关联规则挖掘 3.1 基本概念 3.2 基于候选集生成-测试方法生成频繁项集 3.3 FP-growth:基于深度优先搜索的频繁项集生成算法 3.4 关联规则的评估方法 分类算法 4.1 决策树归纳 4.1.1 ID3算法 4.1.2 C4.5算法 2 2 掌握数据预处理的常用算法 6 大班讲授 课程目标2 3 掌握关联规则挖掘的概念,主要算法,并能够评价关联规则。 4 大班讲授 课程目标2、3 4 掌握分类算法的主要思想,能够针对不同的实际问题运用适当的分类器。 12 大班讲授 课程目标2、3 5 6
4.1.3 从决策树提取规则 4.1.4 决策树的过分拟合 4.1.5 决策树剪枝与优化 4.1.6 随机森林算法 4.2 贝叶斯分类器 4.2.1 贝叶斯定理 4.2.2 朴素贝叶斯分类器 4.2.3 贝叶斯信念网络 4.3 基于实例的学习算法 4.3.1 K-NN分类器 4.3.2 局部加权回归 4.3.3 基于案例的推理 4.4 回归分析 4.4.1 线性回归 4.4.2 逻辑回归 4.6 分类器算法的评估 聚类算法 5.1 相似性和相异性度量 5.2 聚类算法的分类 5.3 基于划分的聚类算法 5.4 层次聚类 5.5 基于密度的聚类算法 5.6 可伸缩的聚类算法 5.7 簇质量的评估 异常检测 6.1 统计方法 6.2 基于聚类的检测技术 掌握聚类中相异性度量的概念、掌握核心的聚类算法,了解不同算法的优缺点。 12 大班讲授 课程目标2、3 了解异常检测的概念,掌握主流的检测技术。 4 小班项目研讨 课程目标3 实验大纲:
分类项目开发实验 应用决策树、随机森林、朴素贝叶斯、KNN算法,进行项目开发。 项目交流与答辩 课程目标1、4 1 4 2 聚类项目开发实验 应用K-Means、Bisecting K-means、Dbscan算法,进行项目开发。 4 项目交流与答辩 课程目标1、4
五、课程教学方法
本课程教学将结合大班讲授、小班项目研讨、项目开发以及交流与答辩的形式。大班讲授主要培养学生对各种核心技术的掌握。小班项目研讨用来训练学生们沟通与交流的能力,同时提高对系统进行评价的能力。通过指导学生实现课堂上讲授的算法,学会比较各个算法的性能差异,激发学生的研究和创新兴趣。
六、课程考核方法
考核环节 (1)实验 (2)交流与沟通 (3)期末考试 所占分值 30% 10% 60% 考核与评价细则 根据项目开发的结果质量 根据项目小组在答辩与沟通过程中的表现 闭卷考试 对应课程目标 课程目标1 课程目标4 课程目标2、3 七、主要教材与参考书(黑体、小四、加粗、行距20磅)
1. 《大数据分析与挖掘》
纲撰写人: 石胜飞
因篇幅问题不能全部显示,请点此查看更多更全内容