河北东方学院
本科毕业论文(设计)中期检查报告
题目 | : | 基于回归分析的武当山景点游客流量分析与预测 |
学院 | : | 人工智能学院 |
专业 | : | 数据科学与大数据技术 |
班级 | : | 大数据技术21-2 |
学生姓名 | : | |
学 号 | : | 215150302036 |
指导教师 | : | 闫建薇(副教授) |
完成时间 | : | 2024年12月28日 |
一、工作任务的进展情况 (一)系统模块完成情况 1.用户信息管理模块 (1)注册和登录功能:已实现基本的用户注册和登录功能,包括用户和管理权限、密码、手机号、邮箱等信息的录入与修改。 (2)个人信息管理:完成了个人信息的增删改查功能,用户可以在线更新个人资料。 2.景点数据查看模块 (1)数据查看和搜索:实现了游客流量数据的基本查看和搜索功能。 (2)数据筛选:完成了按时间、日期、地点等多维度的数据筛选功能与展示。 3.景点数据处理模块 数据清洗和处理:使用Pandas库对已收集到的游客流量数据进行了初步的清洗和预处理、分析、特征工程等工作。 4.游客流量可视化分析模块 通过Echarts实现了部分游客流量数据的可视化,实现了趋势图等基础可视化功能。 (二)技术方面实现与进展 1.数据采集:使用Selenium模拟浏览器爬虫技术,在2天期间,成功从携程平台上爬取了关于武当山景点的游客流量数据。此次数据采集历时约一个月,共获取了约10000条数据记录。 2.前端技术:利用HTML、CSS、JavaScript构建了基本的页面布局并成功引用Echarts.js库进行了一部分数据可视化。 二、工作中遇到的问题及改进措施 (一)遇到的问题 1.在数据采集过程中,发现部分数据存在缺失与异常。 2.复杂的模型可能需要计算资源构建模型时耗时较长;而且初步构建的预测模型精度有待提高。 (二)改进措施 1.通过多渠道收集数据,如结合景区售票系统、游客调查等,以弥补数据缺失。同时,采用数据插值、异常值过滤等方法处理。 2.选择合适的模型性能至关重要,优化模型、减少计算复杂度、优化数据库查询语句提高数据处理效率。同时,增加训练数据量、调整模型参数。 三、下一步工作计划 (一)模型优化与验证 1.继续调整模型参数,并尝试引入更多潜在的影响因素,以期提高预测模型的精度与可靠性。这些潜在的影响因素可能包括但不限于天气条件、节假日安排、特殊活动举办情况、竞争对手的游客流量等。在引入这些因素之前,我会进行充分的调研和数据分析,以评估它们对武当山景点游客流量的可能影响。 2.采用测试数据集验证模型效果,根据验证结果进一步优化模型,确保模型的稳定性和可靠性。 (二)可视化分析完善 多次进行调试,根据流量趋势图、散点图等多种图表类型进一步完善和优化数据可视化功能效果,提高用户体验。 (三)系统性能提升 1.优化数据库查询逻辑,减少不必要的数据库访问。 2.引入分布式处理,提高大数据处理能力。 (四)功能完善与用户体验优化 1.使用模板语言实现页面布局与交互设计、前后端数据交互,提升用户体验。 2.加强管理员对后台数据的全面管理(增删改查操作),完善数据导出和备份功能。 (五)毕业论文撰写 1.梳理论文的设计,包括数据采集、数据可视化、测试等。 2.撰写论文的研究背景与意义、查阅过的参考文献、设计的一部分系统模块,记录模型构建与分析。 3.完成毕业设计的初稿撰写。 学生签名: 日期:2024年1月5日 | |
指导教师意见: 指导教师签名: 2024年1月6日 | |
系/教研室意见: 负责人签名: 2024年1月8日 | |