襄阳市网站建设_网站建设公司_后端开发_seo优化
2025/12/22 10:29:17 网站建设 项目流程

图书推荐与管理系统(Qmazon)

简介

这是本人于本科二年级时修读的"面向对象的程序设计(C++)"的课程作业。该系统实现了一个关于图书的评论与推荐系统,类似亚马逊、当当与豆瓣。该系统使用 C++ 作为编程语言,并使用了 Qt 程序开发框架完成了程序的可视化,搭建了类似 PC 版 QQ 风格的界面,具有很高的美观度。本系统针对图书推荐这一核心功能采用了基于用户的协同过滤算法,并结合基于人口统计学的冷启动推荐算法完成了推荐模块的设计。

数据集 :Book-Crossing压缩包内

数据集三个 CSV 文件请手动去掉文件最后一行的空行!!!!!!!!

并在编译项目后,将数据放至 build 目录相应编译模式文件夹下!!!!!!!!

系统展示图

需求分析

此系统对我们提出的需求可以分为前端功能和后端功能,前端功能即普通用户的一些操作功能,包括用户的注册、登录、获取推荐、打分、评论、更改信息、注销账户、查找图书、查找好友等功能,后端功能包括管理员的一些操作功能,包括管理员的登录、添加图书、删除图书、更改图书信息、添加新用户、删除用户、更改用户资料、查找图书、查找用户、注销账户等功能。因此在 CLI(命令行界面)下我们需要首先设置登录与注册功能、登陆后根据登录身份的不同来设计可以进行的不同功能。而在 GUI(图形用户界面)下我们需要设置登录界面、注册界面、管理员功能界面、用户功能界面、以及用户的各个子功能界面。命令行界面的实现将通过 VS、Dev-Cpp 来实现,而图形化界面将在 CLI 代码的基础上通过 Qt Creator 编译并实现。

类的设计

本程序主要的类有两个,其定义在 base.h 头文件中:图书(book)类与用户(user)类。具体定义及操作可见 base.h 头文件,这里便不再多说。其函数具体定义在 Main.cpp 文件中。

文件操作

1、图书信息

使用 ifstream 打开文件后,将每条读入的数据暂存到一个 Book 类型的 newbook 中,这本书的所有数据读完之后,将 newbook 使用

books.insert(map<string, Book>::value_type(IS, newbook));

加入到总的 book 这个 map 类型的对象中中。其中 IS 为 newbook 的 ISBN 码,直接用来索引图书。
书的各类信息分隔使用

getline(file, value, ';'); IS = string(value, 1, value.length() - 2);

表示读到“;”之前的数据,并且 IS 的内容是 value 去掉最前面的“与最后面的”所得。
最后使用c++file.close();关闭文件。

2、用户信息

与图书信息的读入过程类似。

3、评分信息

先用 ifstream 打开文件,之后用

getline(file, value, ';'); string(value, 1, value.length() - 2);

读入 IS 与 ID,再直接利用 map 的索引将信息读入每个信息的对应项之中。并且增加读过这个 book 的用户信息,与这个 user 看过的图书信息。

users[ID].booksRead.insert(map<string, int>::value_type(IS, rank)); books[IS].usersRead.insert(map<string, int>::value_type(ID, rank));

最后使用 file.close();关闭文件。并且读完用户全部评分信息后,使用迭代器将每个 book 与每个 user 的平均评分求出。例下面就是求出每个 book 的平均分的代码。

map<string, Book>::iterator iter = books.begin(); for (; iter != books.end(); iter++) { iter->second.aveRank = iter->second.sum / iter->second.cnt; }
4、文件回写

由于又增加修改删除的图书用户等,在使用过一遍系统后要将所有信息全部重新写入。

book 文件写回

先用 ofstream 打开文件,之后先写回标题栏。

file << "\"ISBN\";\"Book-Title\";\"Book-Author\";\"Year-Of-Publication\";\"Publisher\""<< ";\"Image-URL-S\";\"Image-URL-M\";\"Image-URL-L\"" << endl;

之后将每一类信息写回,双引号使用\”表示。
最后

file.close();

关闭文件。

user 文件写回。

先用 ofstream 打开文件,之后先写回标题栏。

file2 << "\"User-ID\";\"Location\";\"Age\"" << endl;

之后将每一类信息写回,双引号使用\”表示。
最后

file.close();

关闭文件。

rank 文件写回。先用 ofstream 打开文件,之后先写回标题栏。
file3 << "\"User-ID\";\"ISBN\";\"Book-Rating\"" << endl;

之后将每一类信息写回,双引号使用\”表示。
最后

file.close();

关闭文件。

基于用户的协同过滤推荐算法

对于一个已经读过几本书的用户,我们采用的推荐方法便是采用正常的基于用户的协同过滤算法。基于用户的协同过滤推荐算法的基本思想便是:首先依据依据用户对物品的评价计算出所有用户之间的相似度,之后选出与当前用户最相似的 N 个用户,再用 N 个邻居用户对物品的评分,预测当前用户对没有浏览过的物品的可能评分,最后按照预测出的可能评分的高低向当前用户推荐物品。 接下来将对算法的实现进行详细介绍。算法在程序中的位置为 recommendsystem1.cpp 中的

User:: getrecommendation()

首先我们要先进行对与所有用户的相似度计算。计算的基本公式如下:


当我们计算当前用户 A 与用户 B 的相似度时,首先我们要先去遍历 A 读过的书,从这些书里去找到 B 同样也读过的书,找到相应的书后,这本书便是公式中的 p。以上公式可分为三个求和部分,因此函数中我采用了 sumup,sumdown1,sumdown2 分别累加。之后通过套用公式并对所有其共同读过的书进行累加计算出用户 A 与 B 的相似度,并通过第一层类似地计算出 A 与所有用户的相似度,将相似度存于一个

map<string, double>Sims

即当前用户与 id 为 String 的用户的相似度。
到这里我们计算出了当前用户与所有用户的相似度,接下来我们便可以选取邻居用户进行预测分数。在这里的邻居用户数我选定为全体用户(27w+),原因是由于数据集本来就是就很稀疏本来能够拥有相似度的用户就很少,因此采用全体用户即可最为准确的进行推荐且不会造成速度上的缓慢。预测公式如下:

首先我们从所有书中去遍历,并筛选出该用户没有读过的书,假定现在我们要预测图书 P 的预测评分,则接下来去从所有读过 P 的人中去寻找,找到与当前用户有相似度的用户,按照上边的公式进行计算并累加,便可以计算出 P 的预测评分。类似地,便可以计算出所有图书的预测评分。在这里我将所有预测评分存在了一个 map<string, double> RankPre 中,string 指的是书的 ISBN 码,double 指评分。
之后便是排序过程,这里我首先写了一个将 map 中的元素按降序排列并存储在 Vector 的函数

void sortMapByValue(map<string, double>& tMap, vector<pair<string, double> >& tVector)

将之前的 Rankpre 排序后存于 Rvector 中,接下来便可以将 Rvector 前几个元素输出即为推荐图书了。
在计算推荐图书的过程实际上也顺便进行了推荐好友的计算,即相似度 Sims 已被我们存储。之后再将 Sims 调用 sortMapByValue 函数进行降序排列并存于 Svector 中,再输出前几个元素便为推荐好友。
同时,还有一点值得注意。如果一个用户读过书,但读的书过于少或过于“冷门”,以至于没有人与其读过相同的书,即没有人和他拥有相似度,则对他仍作冷启动处理。
以上便是算法的原理与实现的基本内容。还有值得一提的地方,便是如果两个用户读过的书一模一样,直观上来说其相似度应该是非常大的(1),但套用公式分母则是 0,无法计算,因此我采用了特殊处理,如果两个用户读过的书完全一样(isequal),则相似度直接置 1,这样或多或少能够降低误差考虑了极端情况。

Qt 框架的使用

本项目使用了 Qt 进行了 C++ 的可视化。在 Main.cpp 函数中,首先要将 Qt 自动产生的各个界面的头文件引入。之后对每个界面每个按钮的事件进行函数书写即可。如删除图书的事件触发函数:

void menu_admin::on_pushButton_3_clicked() { bool ok; // 获取字符串 QString qid = QInputDialog::getText(this,tr("input"), tr("input the id:"),QLineEdit::Normal,tr("admin"),&ok); string id=qid.toStdString(); if(books.find(id)!=books.end()){ books[id].deletebook(); } else{ QMessageBox::information(this,tr("tip"), tr("cannot find so you cannot delete!"),QMessageBox::Ok); } }

本项目一大亮点之一便是出色的 ui 设计。而 ui 设计的完成很大一方面也要归功于 Qt 这一框架强大的 ui 设计功能。我们在 Qt 的 ui 模式下可视化操作设计过程并通过 qss 文件进行辅助,而 qss 文件的语法与 CSS 是极其相似的,因此也极易上手。

时空分析

1、时间复杂度

本程序主要的用的容器是 map。在 C++ 中,map 根据 key 的值去查找,本质上讲使用的是红黑树的数据结构,因此搜索时的时间复杂度为 O(logn)。在 map 插入一个键值对时,因为没有最优位置暗示,所以插入删除的时间复杂度为 O(logn),而插入删除多个键值对的时间复杂度为 O(nlogn),但由于图书用户信息的修改只是有限的几次,故可以直接认为时间复杂度为 O(logn)。

在文件读取时,就已求出书的平均分并存好数据,这里时间复杂度为 O(n)。文件写回时也是一次性顺序写回,时间复杂度也为 O(n)。

修改图书、用户信息,用户评分的时间复杂度都是 O(1)。

冷启动推荐算法,将用户按照信息相似度匹配,时间复杂度为 O(n),依次取出用户高评分书籍或者根据 200 个最相似用户的评分预测当前用户评分,时间复杂度为 O(1),因为 200 个用户相对于总共 20 万用户来说可看作一个小的常数。

基于用户的协同过滤算法,为指定用户推荐图书时,先找出与当前用户相似的用户,时间复杂度为 O(n),再按照协同过滤算法公式预测计算,由于每个用户读过的书数量不会太多且固定,所以可以看做常数,时间复杂度为 O(n)。

综上,本实验的时间复杂度为时间复杂度为 O(n)。

2、空间复杂度

本程序的存储思想类似于稀疏矩阵,并不是建立一个 N*M 的用户 — 图书二维数组,而是只保存有意义的信息值。尽管同一项键值对保存了两次(每种图书被哪些用户看过及评分,每个用户看过哪本图书及评分),但这并不影响最终的空间复杂度,相当于最终空间复杂度为 O(n*m)。且 map 容器的空间复杂度为 O(n)与 O(m)。所以最终程序的空间复杂度为 O(n*m)。

未来展望与改进

由于程序采用文件操作,而本项目的数据集较大,三个 CSV 文件共计 118MB,故程序入口处的文件读取操作是耗时且用户体验较差的。由于二年级上学期未学习数据库的相关课程,因此没有采用数据库存储,这也是一大遗憾。相信本项目若是之后能采用数据库存储数据,必然能够很大程度上增进用户体验。

♻️ 资源

大小:387KB

➡️资源下载:https://download.csdn.net/download/s1t16/87400358

注:更多内容可关注微信公众号【神仙别闹】,如当前文章或代码侵犯了您的权益,请私信作者删除!

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询