摘 要
得益于深度学习和自然语言处理等人工智能技术的不断发展,计算机在理解自然语言方面取得了巨大进步。这一进展使智能客户服务系统等实用的自然语言处理应用程序能够更好地理解和回答用户问题。这些技术在公司的有效应用使智能客户服务系统成为可能。智能客服系统可以帮助员工解决各种问题,如信息请求、技术支持、业务流程指导、培训和学习,以及回答常见问题。通过提供准确的支持和实时响应,该系统可以提高员工的工作效率,减轻工作压力,帮助他们更好地应对工作挑战。本文的研究目标是为电子商务行业构建自动化智能客户服务。本文的主要研究内容包括以下几个方面。自动智能客服的基本部分是一个算法模块,它根据电子商务行业的咨询特点设计和实现了一个算法引擎模块。本文对自动化智能客服进行了深入研究。鉴于电子商务用户提出的问题通常是目标驱动的,我们最终决定基于一对问题和答案构建一个智能客户服务。本文抽象了智能客服在根据用户问题在知识库中选择最合适的问题的过程中回答用户问题的过程。实现这一过程的关键是语义匹配算法。目前,深度学习在语义匹配方面取得了良好的效果。训练深度学习算法需要大量的数据,算法的最终性能与数据集的质量密切相关。本文收集了大量的客户支持数据,并使用手动和自动注释方法相结合的方式构建了一套电子商务领域的问答。本文基于构建的语料库,实现了各种语义匹配算法,比较了它们在数据集上的性能。实验结果表明,基于对流神经网络的算法模型效果最佳。本文构建了一个完整的智能客户服务,并为智能客户服务提供了一个支持性的知识库管理模块。本文实现的智能客户服务可分为三个模块:查询解析、信息检索和响应生成。问题解析器对用户的问题进行分类,并分析其真实意图。信息检索模块从知识库中检索与用户问题最匹配的问题。答案生成器检索问题的答案并将其返回给用户。本文设计并实现了一个用于智能客户服务的知识库管理模块。知识库管理模块支持添加和修改问答对,为智能客服提供准确的培训数据。同时,知识库管理模块可以收集用户查询并定制智能客户服务,为系统分析和改进提供依据。
关键词:智能客服;电商;卷积神经网络;深度学习
Abstract
With the continuous development of artificial intelligence technologies such as deep learning and natural language processing, computers have made tremendous progress in natural language understanding. This progress enables practical applications based on natural language processing, such as intelligent customer service systems, to more accurately understand and respond to user questions. Within the enterprise, the efficient application of these technologies makes intelligent customer service systems possible. The intelligent customer service system can help employees solve various problems such as information inquiry, technical support, business process guidance, training and learning, and answering common questions. By providing real-time and accurate support and answers, the system can improve employees’ work efficiency, reduce work pressure, and help them better cope with work challenges. The research objective of this article is to build an automated intelligent customer service for the e-commerce field. The main research content of this article includes the following aspects. The core part of automatic intelligent customer service is the algorithm module. This article designs and implements an algorithm engine module based on the consulting characteristics of the e-commerce industry. This article conducts in-depth research on automatic intelligent customer service. Considering that the questions asked by e-commerce users are generally goal driven, we ultimately choose to build intelligent customer service based on question and answer pairs. This article abstracts the process of intelligent customer service answering user questions into the process of selecting the most matching question in the knowledge base with the user’s question. The key to implementing this process lies in the semantic matching algorithm. Currently, deep learning has achieved good results in semantic matching. The training of deep learning algorithms requires a large amount of data, and the final performance of the algorithm is closely related to the quality of the dataset. This article collected a large amount of customer service data and constructed a Q&A collection in the e-commerce field using a combination of manual annotation and automatic annotation. This article is based on a constructed corpus and implements different semantic matching algorithms, comparing their performance on the dataset. The experimental results show that the algorithm model based on convolutional neural network performs the best. This article constructs a complete intelligent customer service and provides a supporting knowledge base management module for intelligent customer service. The intelligent customer service implemented in this article can be divided into three modules: question parsing, information retrieval, and answer generation. The question parsing module classifies the user’s questions and analyzes their true intentions. The information retrieval module retrieves the question that best matches the user’s question from the knowledge base. The answer generation module retrieves the answer to the question and returns it to the user. This article also designs and implements a knowledge base management module for intelligent customer service. The knowledge base management module supports adding and modifying question and answer pairs, providing accurate training data for intelligent customer service. At the same time, the knowledge base management module can collect user inquiries and match intelligent customer service, providing a basis for analyzing and improving the system…
Key Words: Intelligent customer service; online retailers; Convolutional neural network; Deep learning
目录
第1章 绪论 3
1.1 研究背景与意义 3
1.2 国内外研究现状 4
1.3 研究内容 8
第2章 关键技术介绍 9
2.1深度学习技术 9
2.2 智能客服系统设计与实现 9
2.2 智能客服介绍 10
2.3深度学习算法在智能客服中的应用 11
2.3.1知识库的自动构建 12
2.3.2问句解析 12
3 系统分析 15
3.1 需求分析 15
3.1.1 系统需求概述 15
3.1.1问答模块需求分析 15
3.1.2 知识库管理模块需求分析 17
3.2 非功能需求分析 20
3.2.1安全性 20
3.2.2可靠性 20
3.2.3性能 21
3.2.4拓展性 21
3.2.5易用性 21
3.2.6可维护性 21
3.3本章小结 21
第 4 章 系统设计 22
4.1 系统架构 22
4.2 问答模块设计 23
4.3 知识库管理模块设计 24
4.4 数据库设计 26
4.5文本匹配算法设计 26
4.6 本章小结 26
第 5章 系统实现 27
5.1. 知识库管理模块实现 27
5.2. 问答模块构建实现 27
第 6章 系统测试 28
6.1 性能测试 28
6.2 测试的主要内容 28
6.2.1功能测试 28
6.2.2 性能测试 30
6.2.3 安全性测试概述 31
6.2测试结果与分析 32
6.3本章小结 32
第7 章 总结与展望 33
7.1 研究成果总结 33
7.2 未来研究方向 34
参考文献 35
第1章 绪论
1.1 研究背景与意义
20世纪以来,这个时代有传统的企业对企业交易,在微信、微博、移动程序和网站等许多企业中进行一次电话交易,需要更高的专业知识和客户的工作时间。中国人口分析的减少导致劳动力成本增加,客户服务的正常员工在时间、精力和劳动力成本方面逐渐每年都在增加。同时,公司客户的服务质量取决于其员工的专业服务质量,导致实际商业条件下的服务不平等。因此,CCP逐渐转向新型公司扩张。目前用于解决CCP暴露的许多问题的工具是提供给CCP的。智能客户服务的核心是使用自然语言处理(NLP)技术来提高对面向业务的位置信息的理解,并解决自我响应问题。具体来说,网上购物和直播销售目前非常受欢迎,他们面临的大量信息很难手动处理。因此,一个好的智能产品客服系统无疑将有效提高用户的购买效率,增强他们对购物平台的体验,提高购物平台的竞争力。尽管当前的智能客户端系统已经取得了很大的进步,但在查看如此大的信息时,仍然存在结果率和性能不可靠的问题,尤其是同一单词的视觉错误问题。例如,在以下情况下,视网膜在年龄上出现两次,但翻译结果却相反。这个问题大大降低了系统的安全性。。
1.2 国内外研究现状
智能问答的目标是构建一个能够模拟人类问答的智能系统。智能客服系统按照答案的信息来源可以分为三类:智能客服系统可分为三类:问答对智能客服系统、段落文本智能客服系统和存储在特定结构中的数据智能客服系统。此外,根据提问的领域,智能客服系统可分为三类:基于不限制任何主题或内容的开放领域的智能客服系统,基于特定领域或专业,以及基于非标准题库。早期的模式匹配机器人通常面向一对问题和答案,而基于特定领域或职业的智能客户服务系统通常面向存储在特定结构中的数据,只能回答与特定领域或专业相关的问题,如足球、篮球、服装或其他行业。这种基于非标准题库的智能客户服务系统的典型例子通常集中在常用的问答对、答案和答案上,并使用语义分析文本。
1.模式匹配智能客服系统:
聊天机器人是早期问答系统呈现的主要方式,这些系统中的大多数都使用模式匹配。对于特定的问题,使用正则表达式来解决数据库中模板的问题,并用不同的语料库填充模板以获得目标答案。这种类型的系统更擅长处理常见的对话问题和解决特定职业或领域的问题,但不能处理与领域密切相关的问题,可移植性差,回答问题的质量在很大程度上取决于模板和内置海量数据库的构建。
2.知识库智能客服系统:
知识库问答系统,用知识图谱作为代表,他主要构建了一个图表结构,可以表示所有知识及其联系,将行业相关知识视为个体,并使用边来表示个体之间的关系。“关系实体”是整个图表结构的最小单位。在知识查询的情况下,用户提出的自然语言问题通过语义提取、阅读理解和其他搜索整个数据库并获得所需答案的技术转化为与图表结构相关的搜索问题。目前,包括知识图表在内的大量知识库的构建需要行业专家手动完成,这造成了一个主要的缺点。知识库通常需要涵盖给定领域的所有知识或信息,构建如此庞大的数据库无疑需要大量的人力和时间。此外,每个领域的知识体系和参与者往往不同。如果你想改变领域,你需要重建知识库,这将使人力成本和时间加倍。因此,这种方法不适合自动回答开放域问题。
3.社区问答智能客服系统:
在常见的社区问答系统中,用户可以在互联网上随时随地发布问题并回答他人的问题。例如,百度知道是一个常用的问答系统,它几乎涵盖了日常生活中的所有问题,在解决各种用户问题方面发挥着关键作用。社会问答系统满足了新宗用户的需求,它基于在所有问答数据中找到与用户提问语义最相似的历史问题,同时向用户呈现其历史答案。
社区问答系统的优势在于,它有大量与系统互动的真实用户,这使得系统能够获得有关用户行为的丰富信息,如用户积分、采用率、评论、页面点击率、问题搜索率以及每个问题和答案与用户之间的关系。关于用户行为的丰富信息可以有效地评估系统响应的有效性。然而,该系统也存在一些问题,例如“词汇差距”,即不同的单词具有相同的语义,可能看起来不同,但它们的真正含义是相同的。例如,代表父亲的单词是“爸爸”、“爸爸”和“爸爸”等。因此,在这个系统中,关键字检索模型很难取得良好的效果。因此,用户经常发现对话或搜索结果没有回答问题。
4.检索式问答智能客服系统:
检索式问答系统主要有两类,这些是基于搜索的问答系统和非基于搜索的答疑系统。基于检索的基于搜索的问答系统需要首先获取包含答案的文本,通常使用问题分析和文本检索等方法,然后在不搜索的情况下基于问题检索提取答案系统:首先,构建一组候选答案索引;其次,接收问题,预选一些候选人的答案,然后对问题和答案进行匹配和排序,最后返回最佳答案k。
与知识库问答系统和社会问答系统相比,下载问答系统具有无限的数据源。搜索-查询-响应系统可以使用搜索引擎和其他工具在互联网上搜索与查询相关的各种文档,同时搜索-查询/响应系统还可以扩展索引集。此外,与基于知识的问答系统相比,基于下载的问答系统不需要扩展和维护知识库,这也是一项巨大的成本。。
5.生成式问答智能客服系统
生成式问答系统主要使用的是Seg2Seg(SequcncetoSequence)15]模型。SEG2Seg,也称为序列到序列算法框架,于2014年提出,是深度学习中的一种特殊模型。通过提供输入序列并使用中间深度神经网络逐层提取特征,可以获得输出序列,其中任何文本、语音、图像或视频数据都可以作为输入序列。该算法的主要思想是将输入序列转换为矩阵向量,这是所有深度学习方法的重要步骤,然后通过分析向量中的信息生成输出列。Seg2Seg模型有两个重要结构,即编码器和解码器。其中,编码器将序列转换为向量,而解码器将向量转换为顺序输出。2019年,J.Devlin等人提出了一种基于Seg2Seg结构的语言表示模型,称为BERT。利用Transformer编码器的双向表示,通过联合调整所有层前后的上下文,从无标记文本中预训练深度双向表示向量。该模型在11个自然语言处理任务中取得了最新成果。。
生成式问答智能客服系统也是现在主流的智能客服系统,AliMe和Microsoft Xiaobing属于世代模型,基于Seq2Seq结构。这种结构不需要构建自己的知识库或索引集,并且可以生成客户期望从产品文档中得到的答案。同时,问题生成答案模型具有理解文本语义的能力。具有相同语义的单词由具有相似距离的单词向量表示。该模型对具有相似距离的词向量进行处理,以获得具有相似值的概率值,具有相似值地概率值对应于相同的输出,能够从一定程度上缓解“词汇鸿沟”问题。。
1.3 研究内容
随着深度学习和自然语言处理等人工智能技术的不断发展,计算机在理解自然语言方面取得了巨大进步,实现了基于自然语言处理的实际应用,如智能客户服务系统,更准确地理解和回答用户问题。这些技术在公司的有效应用使智能客户服务系统成为可能。智能客服系统可以帮助员工解决各种问题,如信息请求、技术支持、业务流程指导、培训和学习,以及回答常见问题。通过提供准确的支持和实时响应,该系统可以提高工人的工作效率,减轻工作压力,帮助他们更好地应对工作挑战。
第2章 关键技术介绍
2.1深度学习技术
深度学习技术是人工智能领域中一种基于多层神经网络的机器学习方法,可以处理和分析大型、非线性和复杂的数据集。在各个领域,深度学习技术已经显示出无与伦比的性能优势。例如,人脸识别、语音识别、图像识别和自然语言处理是深度学习技术的典型应用。
深度学习模型的本质是使用多层神经元来实现特定目标。通过反向传播算法,神经网络可以独立调节其权重和偏见。通过这种方式,可以优化模型,逐步提高分类或回归的准确性。与传统的机器学习算法相比,深度学习可以通过发现复杂的特征和非线性关系来执行更有效的分类和回归。
2.1.1 线性感知器算法
一个感知器[17]由输入权值、激活函数和输出组成,其存在的问题是,当感知器数据集不能线性分离时,感知器规则将不会收敛,感知器也无法训练。为了解决这个问题,我们使用微分线性函数代替感知器阶跃函数。这种感知器被称为线性单元。当线性元素遇到无法线性分离的数据集时,它们会收敛到最佳近似值。
将权重项和偏置项初始化为0,然后利用下面的感知器规则迭代的修改ω和b,直到训练完成。
ωi←ωi+∆ω
b←b+∆b
其中,∆ωi=η(t−y)xi,∆b=η(t−y)。ωi是与输入xi对应的权重项,b是偏置项。事实上,可以把看作是值永远为1的输入xb所对应的权重。t是训练样本的实际值,一般称之为label。根据公式计算得出感知器的输出值y。η是一个称为学习速率的常数,用于控制每一步调整权的幅度。
每次从训练数据中获取样本输入向量时,传感器都会计算其y输出,并根据上述原理调整权重,为每个处理过的样本调整一次权重。。
2.1.2 卷积神经网络算法
卷积神经网络(CNN)是近年来备受关注的最重要的神经网络类型。图像和语音识别领域的几乎所有重大突破都得益于卷积神经网络,如谷歌、微软ResNet等。击败李世石的AlphaGo也使用了这种网络,下图2.1为卷积神经网络示意图。
图2.1 卷积神经网络示意图
与之前的神经网络不同,卷积神经网络引入了感受野、公共权重和子采样。三个新概念。这三个功能不仅协同工作,它们不仅在分类或识别对象方面发挥了很好的作用,而且它们的有效性更重要,因为深度学习高分辨率图像处理很容易实现。在之前的深度模型框架中,如自动编码器,输入层和隐藏层是完全连接的。如果输入采样数据的大小很小(如8 * 8或28 * 28),则从计算的角度来看,它将起作用。但是,尽管有更大的图像数据(例如96 * 96,256 * 256或更多的自然图像),通过完全连接的网络计算特征将非常耗时。例如,如果您有10个第四(= 10000)个输入单位,假设您正在学习100个功能,则有10个第六个功率参数。与28 * 28补丁图像相比,96 * 96图像是完全连接的网络训练,并且计算过程是倍增功率(= 100)的10倍。为了减少连接参数的数量,卷积神经网络引入了对流或松耦合的概念来解决这些问题。简而言之,卷积神经网络的核心是通过结合三个结构感受野、权重分布和下采样来实现一定程度的位移、规模和变换的不变性。
●卷积
卷积即对图像做滤波,而滤波器的大小则为感受野的大小,下图2.2为卷积原理图。图像的统计特征在所有区域有相似性,我们都能使用同样的学习特征即同样的滤波器或卷积核。假定给定了γ×c 的大尺寸图像,将其定义为Xlarge。首先通过从大尺寸图像抽取的a×b的小尺寸图像样本Xsmall训练自编码,计算f=σ(W1Xsmall+b(1))(σ为激活函数)可得到k个特征,其中W1和b(1)是可视单元和隐含单元之间的权重和偏置。对于每一个a×b大小的小图像Xs,计算对应的fs=σ(W1Xs+b(1)),对这个fconvolved值做卷积,就可得到k×(γ−α+1)×(c−b+1)个卷积后的特征矩阵[19]。
图2.2 卷积原理图
●权值共享
在卷积神经网络中,通常在卷积层之后,有一个成对出现的采样层。在滚动层中,有单独的过滤器,可以混淆前一层的不同输入字段,即同一图像的不同区域。在过滤完整输入图像后,一个过滤器显示功能图。假设一张Image为5 * 5大小,而滤波器的尺寸为3 * 3,则每个感受野区域的大小也为3*3,滤波器步长为1,则特征图的大小为(5 - 3 + 1) / 1 = 3,即3 * 3。若无权重共享,则Image中一共有9个感受野,每个感受野区域的大小为个3 * 3 = 9连接参数,加上偏置项,一共10个训练参数,则全图共需要的参数个数为9 * 10 = 90。但若有权值共享,即不同感受野共享同样的连接权值,即全图只需要10个连接参数。卷积神经网络训练参数的数量由于权值共享的提出,被大幅度降低,省下了训练数据集的大量时间。
●下采样(池化)
理论上,我们可以使用所有函数来训练分类器,但这可以在小图像上实现,然而,对于大图像,我们将不得不面对计算复杂性和操作效率的问题。
降采样是解决这一问题的关键方法。下采样转换内核只取最大值、平均值等。并且不接收来自反向传播的任何变化。对流过程可以从局部原始图像中提取关键信息,然后通过训练过程将这些信息传递给下一层,实现功能级图像提取和处理。使用转换函数的原因是图像具有“静态”属性,即图像和接受字段具有不同的功能。因此,一个自然的想法已经成为不同地点特征的统计总结,事实上就是这样做的。对不同位置的特征进行汇总和统计分析更为合理,例如计算该区域特征的平均值或最大值。这样,计算出的特征不仅可以表示原始的高维特征,还可以使结果不易受到过度匹配的影响。Joining[20]不仅具有上述功能,而且具有图像变换的不变性。因此,有界函数集可以改进后续的分类。下图2.1为池化的原理图。
图2.3 池化原理图
2.1.3 循环神经网络算法
有许多类型的重复神经元网络(RNN)。由于篇幅、时间和专业知识的限制,本文将只关注最基本类型的RNN。在克服了这个基础之后,理解扩展形式也将相对容易。
下图2.4是一个全连接网络
图2.4 全连接网络示意图
隐藏层的值只取决于输入的x,而RNN的隐藏层的值s不仅仅取决于当前这次的输入x,还取决于上一次隐藏层的值s,见下图2.5。其中,t是时刻,x是输入层,s是隐藏层,o是输出层,矩阵W就是隐藏层上一次的值作为这一次的输入的权重。
图2.5 基本循环神经网络示意图
RNN [22]的输出层o和隐藏层s的计算方法为ot=g(Vst),St=fUxt+Wst−1;反复代入这两个公式后会得到:
ot=gVst
=VfUxt+Wst−1
=VfUxt+WfUxt−1+Wst−2
=VfUxt+WfUxt−1+WfUxt−2+Wst−3
=VfUxt+Wf(Uxt−1+Wf(Uxt−2+Wf(Uxt−3+…)))
由此可得,在循环神经网络中可以往前看输入任意多个值[21],从而通过循环的网络,让信息具有记忆持久性。
2.1.4 长短时记忆网络算法
长期短期网络记忆算法(Long Short Term Memory Network, LSTM )通常被称为LSTM,是特殊类型的RNN。这是一种时间递归神经网络,多用处理复杂的需要长期学习的使用与实际生活的事件,见下图2.6。
图2.6 长短时记忆网络示意图
RNN和LSTM之间的主要区别在于增加了一个“处理器”来确定信息是否有用。该处理器运行的结构称为单元。这个结构的组成部分是入口门、遗忘门和出口门。消息进入LSTM网络,可以根据规则确定其有用性。合规信息将被保留,并在必要时稍后发布,否则将从遗忘门中删除。以上图3.6中的输入为ht−1和xt的模块为例,它具有比RNN更为复杂的4层重复结构,共经过3次步骤的处理:
(1) 首先,我们使用遗忘门来控制传递的信息是否是我们需要的信息。如果这是我们需要的信息,我们可能会继续全部或部分;如果这不是我们需要的,我们可以通过遗忘门进入网络上的下一个模块继续训练。
(2) 第二步是删除不必要的旧信息,并用新信息替换。我们过滤掉无用的信息,并将其输入到个人的状态中。在更新其状态后,无用的信息被遗忘,新的信息被添加。
(3) 最后,过滤完成,我们根据您的具体要求显示信息部分。输出信息是我们选择公式的结果,由我们控制。
这只是操作原理之一,但它可以解决重复神经网络的长期问题。这使LSTM能够处理不断变化的垂直问题。
2.2 智能客服系统设计
为了实现高效的智能客服系统,我们需要涉及许多获胜领域,包括自然语言处理、文本分类、图像识别和多模态处理。在这里,我们提供了一个通用的解决方案。
1、聊天机器器人
聊天机器人是智能客服系统的核心部分,他可以使用深度学习方法进行训练,以实现自然语言理解、语义分析和问题的智能答案。为了获得问题的自然流畅的答案,我们需要构建一个从大规模语料库中学习的神经网络模型。卷积神经网络、递归神经网络、变换器和其他不同的网络结构用于更好地处理文本数据。
在训练神经网络模型时,需要高质量的训练数据。最好的方法是从真实的客户服务场景中收集对话并对其进行注释。这可以帮助训练自己的模型,提高其准确性,并鼓励聊天机器人更自然、更流畅地回答用户问题。
2、知识库
此外,为了使聊天机器人更加智能,良好的知识库也非常重要。知识库是聊天机器人可以获取和传递由固定规则和数据源组成的信息的地方,例如从现有文档信息中提取的文本。当然,知识库也可以通过构建知识图来扩展,以更好