基于C4.5决策树算法的学生成绩分析系统开题报告

 2022-10-31 10:58:57

1. 研究目的与意义

现在,随着教育的普及以及以成绩评判学生学业成功与否作为标准,每年产生了大量的学生数据,所以我们需要花更大精力对学生成绩进行管理。由于学生成绩管理系统对学生成绩数据的处理还停留在简单的数据备份,查询及简单统计阶段,并没有对这些成绩数据进行深入的分析,找到有利于教学管理的信息,因此对教学信息资源造成了严重的浪费。

本课题是为了使学生成绩更好的保存备份以及分析,从而对教育管理产生积极的推动作用,以便的教育资源的合理分配而产生的,其积极意义主要有以下几点:

1、利用决策树算法产生分类,从分类规则中找出影响学生学习成绩的主要因素及各因素之间的关系,以便学生找出学习中遇到的情况,很快的调整自己。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

1、关键问题

实现基于C4.5决策树的学生成绩系统并完善它,使它运行。

2、课题难点

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

基于C4.5决策树的学生成绩系统是利用决策树算法将数据项映射到一个事先定义的类中的学习过程,针对学生成绩应用C4.5进行数据挖掘,通过实际数据进行分类。系统通过对高校学生成绩进行分析,找出影响学生成绩取得好与坏的因素。这个系统的关键在于对决策树技术的理解。

决策树技术是通过学习,获得输入变量和输出变量不同取值下的数据分类和预测规律,并用于对测试集的分类预测。它主要由两个阶段组成。  第一阶段,建树阶段。选取训练数据集进行学习,导出决策树。

第二阶段,剪枝阶段。用测试数据集检验决策树,如果所建立的决策树不能正确的回答所研究的问题,我们要对决策树进行剪枝以解决过分适应数据的问题,直到建立一棵正确的决策树。原因就是避免决策树过拟合样本。前面的算法生成的决策树非常的详细而庞大,每个属性都被详细地加以考虑,决策树的树叶节点所覆盖的训练样本都是纯的。因此用这个决策树来对训练样本进行分类的话,你会发现对于训练样本而言,这个树表现堪称完美,它可以100%完美正确得对训练样本集中的样本进行分类(因为决策树本身就是100%完美拟合训练样本的产物)。但是,这会带来一个问题,如果训练样本中包含了一些错误,按照前面的算法,这些错误也会100%一点不留得被决策树学习了,这就是过拟合。C4.5的缔造者昆兰教授很早就发现了这个问题,他作过一个试验,在某一个数据集中,过拟合的决策树的错误率比一个经过简化了的决策树的错误率要高,所以剪枝的目的是降低由于训练集的噪声而产生的起伏。  而之所以使用C4.5决策树技术建立学生成绩系统原因有三:一是决策树构造的分类器易于理解;二是采用决策树分类,其速度快于其他分类方法;三是采用决策树的分类方法得到的分类准确性优于其他方法。  我们在分析影响学生成绩的因素,可以通过决策树技术从定量的角度精确展现学生成绩分析的多个方面,找出影响学生成绩的主要因素,以此来帮助教师和教学部门制订相应的措施,有利于提高教学质量和增强教学效果。对采集的学生考试成绩数据进行分析挖掘,形成分类规则,从而更好的分析和预测成绩数据。具体的信息挖掘的操作步骤如下:确定挖掘对象、目标及其数据采集

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

该系统用Java语言开发,是基于J2EE的WEB应用B/S结构开发模式,采用JSP Javascript Html作为其动态页面,,系统数据库采用mysql,运行平台:MyEclipse,操作系统为WindowsXP以上,采用Tomcat6.0.33作为WEB服务器软件。

2、研制方案和研究方案:

主要包括如下功能模块:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

1、(第1-2周)确定毕业论文题目,搜集并阅读与所选课题相关的资料,为撰写论文准备一些基础材料。下发毕业设计(论文)任务书。撰写开题报告,完成外文翻译。

2、(第3周) 指导教师检查学生开题报告和译文完成情况。在熟悉选题的基础上,依据选题的具体功能要求,做好需求分析,划分功能模块并确定每一个模块的功能,画出具体的流程图。

3、(第4-5周)使用所选定的开发工具开发每一个功能模块。定期向指导老师汇报工作进程,并且保质保量实现各个模块。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。