个人简介
一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持!
各位老师好,我是计算机学院 2021 级 xx 同学。我的题目是“基于 Hadoop 的教育平台的设计与实现”。系统用 Hadoop 做底层,把学生在平台上产生的学习日志、成绩、资源点击等大数据收上来,先存到 HDFS,再用 MapReduce 做离线分析,最后用可视化页面把“学生画像、课程热度、成绩分布”结果展示出来。主要分三大角色:管理员管课程/教师/资源,教师上传课件、布置作业、查看学情,学生在线学习、交作业、看成绩;后台还有一个推荐模块,根据历史行为给学生推视频或习题。技术栈简单:Hadoop-3.3.4 做存储与计算,Hive 做 SQL 统计,SpringBoot+MyBatis 做业务接口,前端用 Vue3,图表用 ECharts,服务器是 CentOS7。下面请各位老师提问。
评委老师:为什么一定要用 Hadoop?用 MySQL 不行吗?
答辩学生:MySQL 放几万条成绩没问题,但平台要攒 4 年所有学生的点击日志,数据量会到百 G 级,MySQL 查聚合非常慢。Hadoop 把表拆块并行算,10 分钟就能跑完全校成绩分布,所以选它。
评委老师:你打算怎么收集“学习行为”数据?
答辩学生:前端埋点,学生点一次视频、做一次测验就发一条 JSON 日志到后台,后台直接用 Flume 推到 HDFS,每天凌晨 0:30 定时跑 MapReduce 清洗。
评委老师:平台最核心的功能是什么?
答辩学生:学情大盘。老师打开页面就能看到自己所教班级平均分、及格率、视频完播率,一眼知道哪一章学生最吃力。
评委老师:如果 Hadoop 集群只有 1 台 8G 内存的老机器,能跑起来吗?
答辩学生:不能。我会用学院实验室的 3 台旧主机搭最小集群:1 台 NameNode8G,2 台 DataNode4G,再关掉副本冗余 3 改 2,这样就能跑通演示。
评委老师:数据安全怎么保证?
答辩学生:两条措施:一是 HDFS 目录做权限,学生和教师只能读自己学院的表;二是用 Spring-Security 做登录拦截,密码用 BCrypt 加密,后台日志脱敏存学号后四位。
评委老师:你进度怎么安排?
答辩学生:2025 年 3 月前把 Hadoop 环境搭完并跑通成绩统计;4 月写完 SpringBoot 接口和前端页面;5 月做性能压测并写论文;5 月底答辩。
评委老师:如果推荐模块推错了资源怎么办?
答辩学生:先上“热门排行榜”保底线,推荐只作为“猜你喜欢”小卡片,不干扰正常学习;后期加人工标签权重,让老师给视频打“重点”标签,算法优先推送带标签资源。
评委老师评价:
xx 同学选题贴合大数据热点,技术路线清晰,功能点抓得准,进度安排也接地气。需要注意的是:一是集群规模小,务必在论文里写明实验环境与真实生产的差距;二是推荐算法目前较粗,后续可把协同过滤的冷启动问题再细化。总体开题可行,同意进入下一阶段。
以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取
最后
有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。