电力运维管理领域,电力运维信息知识图谱构建方法

当前的电力运维客服系统每天都在面临着来自各方的海量的客户的心声,企业和个人用户通过微信公众号、微博、掌上电力APP、95598智能互动网站等各种渠道进行业务咨询、故障保修、投诉、举报、建议、意见及表扬、电网信息、政策订阅等,对服务提供及消费提 出了更高的要求,需要及时、准确洞察客户的心声,以最短时间、以最好的服务满足客户的 需求;同时客户要求更友好、方便、快捷的使用我们所提供的服务。为此,需要通过不断提升信息支撑服务,改进客户服务体系来提高客户服务质量和效率,然而在互联网发展的时代, 传统的呼叫中心客服系统需要大量的人力和物力。

[0003] 国网信通部于2015年下达了关于开展信息系统运行管理水平提升活动,提出了切 实提升运行管理水平的要求,信息系统需按照“两级调度、三层检修、一体化运行、统一的客户服务和信息技术三线支持中心”模式,开展信息运维工作,由此积累了大量的运维工单数据。随着大众对电力生产可靠性要求的不断提高,国网公司对供电服务质量也有较高的要求标准。如何不断提高电力信息运维人员的业务素质,在生产中如何快速、准确的处理信息系统运维问题,在日常生产中如何快速查找定位缺陷防范于未然,是电力生产技术和管理者的诉求。

[0004] 面向电力行业构建公共知识图谱存在很多的技术难点,如运维知识的分析较弱, 数据资源价值体现整体停留在粗放型阶段,没有将数据资源有效转化为知识资产,以及没有形成知识良性循环、对业务需求的支撑能力和对管理变革的推动能力较弱等问题,这些都阻碍了电力运维知识图谱的组织与构建。尤其是公司的一单两票系统存在大量的可利用数据,可被有效挖掘和利用,为构建运检修知识图谱提供基础数据及理论依据。

问题拆分

深度学习算法引入到电力领域知识图谱的构建中,釆用命名实体识别和实体关系抽取这两大机器学习的任务来解决知识单元抽取和知识单元关系抽取这两个难题。本发明提高了电力数据的有效利用,发挥数据隐藏的价值,提高电网的智能化应用水平,基于知识图谱的知识表示,将改变过去低维度、相互孤立的信息展现方式,更加直观呈现电力知识之间的关联性。构建电力信息运维系统知识库,将历史运维数据转化为知识,支持用户在线自主咨询和解决问题,实现智能问答,提高运维效率,在电网运维工作中将发挥重要价值,并在此基础上完成电力信息运维领域知识图谱优化存储技术。

问题解决

针对现有技术存在的问题和空白,本发明采用以下技术方案: 一种电力运维信息知识图谱构建方法,其特征在于,包括以下步骤: 步骤1:对电力系统工单数据进行工单采集,并转换为文本格式,并根据文本含义属性 划分为多个文本域; 步骤2:以工单为单位,对工单文本数据进行分词处理; 步骤3:对文本域进行分组; 步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分 组的内容进行词汇切分; 步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇; 步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表, 对己有词汇进行累加其出现的频次; 步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,抽 取实体关系; 步骤8:将实体与实体关系导入图数据库; 步骤9:在图数据库中完成知识图谱的绘制。

[0006] 优选地,步骤8中,将实体和实体关系转化为基于RDF的三元组;步骤9中,通过 PTransE模型将实体和实体关系进行翻译和学习,构建成为知识图谱。

[0007] 优选地,步骤2和步骤4中,分词采用中科院的ICTCLAS系统; 将分词后的所有词组成字符表

图片[1]-电力运维管理领域,电力运维信息知识图谱构建方法-JieYingAI捷鹰AI

[0008] 优选地,步骤2和步骤4中,分词还包括词性特征的构建:词性特征的构建与词特征 的构建方式一致。

[0009] 优选地,步骤7中,釆用句法分析及词法分析将实体关系转化为特征向量,继而采 用机器学习模型进行处理,计算特征向量的相似度,并对实体关系进行分类。

[0010] 优选地,步骤7中,所述预先定义实体关系类型及基于实体的特征包括实体特征、 实体类型特征、实体对相对位置特征、实体间距离特征和上下文窗口特征。

[0011] 优选地,所述PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来, 将逻辑推理规则视为向量加法操作,其评分函数为:

图片[2]-电力运维管理领域,电力运维信息知识图谱构建方法-JieYingAI捷鹰AI

.表不头实体h到尾实体t的关系路径p的势能函数; 对于路径集合

[0012] 优选地,对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内 容进行采集;采用Beautiful Soup包对采集的内容进行解析;采用R环境下的Rwordseg包进 行分词。

[0013] 优选地,所述图数据库为:Ne〇4j图数据库。

[0014] 本发明与现有技术相比,将深度学习算法引入到电力领域知识图谱的构建中,釆 用命名实体识别和实体关系抽取这两大机器学习的任务来解决知识单元抽取和知识单元 关系抽取这两个难题。除此以外,本发明还将图形数据库纳入到构建知识图谱的体系中来, 采用图形数据库对知识单元进行存储及展示,为知识图谱的绘制提供了一种新的方法。

[0015] 本发明提高了电力数据的有效利用,发挥数据隐藏的价值,提高电网的智能化应 用水平,基于知识图谱的知识表示,将改变过去低维度、相互孤立的信息展现方式,更加直 观呈现电力知识之间的关联性。构建电力信息运维系统知识库,将历史运维数据转化为知 识,支持用户在线自主咨询和解决问题,实现智能问答,提高运维效率,在电网运维工作中 将发挥重要价值,并在此基础上完成电力信息运维领域知识图谱优化存储技术。

[0016] 利用本发明构建的知识图谱,可以解决人工重复回答、人员不足等问题,能快速准 确洞悉运维工单申请人的意图,并自组答案为用户解答,大幅提升运维的工作效率。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
来说点什么吧!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容