官方抖音号
微信公众号
摘要:本文介绍一种以知识管理为核心的智慧水务软件体系构想及其可行性研究。这种软件体系主要针对水务专业领域,以该领域的知识管理为核心展开其软件系列的结构。本文试图论述这种软件体系与传统的专家系统、传统的知识管理系统的区别,以及与现有的流行方法相比具有什么优势。
关键词:知识管理,智慧水务,专家系统
一、引言
目前全国水务行业正刮起“智慧水务”之风。对于智慧水务概念中何为“智慧”虽众说纷纭,但总的来说都大致都承认它必须以信息技术为载体,在自动化和计算机的软硬件上下功夫,从而实现企业的相关改革。因此这是一个以信息技术的发展为背景,催生出企业对自身改革愿望的一种实现方式。
单以软件技术方面论,目前谈得比较多的软件核心主要有三种,即水力模型、GIS系统和特定商业智能(比如分析营抄数据来分类用户行为)。其中水力模型是在管网拓扑的基础上,以水力学计算为主要手段,模拟并预测管网中可能发生的情况;GIS系统被认为是“智慧城市”的基础,在其实现对管网拓扑的管理上,展开多种处理技术,可以实现各种智能化功能;特定的商业智能包括数据分析、挖掘等等,在“大数据”一词的流行中,也可以将两者合并来看待。这三种系统技术并不是“智慧水务”的唯一内容,但几乎所有的智慧水务建设大致上莫不围绕此三者展开。比如管网的智能巡检、远程自动抄表、小区域的压力自动控制阀门等等,其软件方面的“智慧性”都是采用三者其一或综合来体现的。
本文拟探讨一种采用第四种“核心”技术的方案,即以知识管理为核心,其特点是并不局限于即时性地运用某一个方面的智慧,而是存储和管理“智慧”,在这样的基础上再来利用其智慧的各种软件系统建设。
二、技术问题分析
过去的“智慧水务”核心技术大致上有如下三个问题:
1.“智慧”的来源单一
水力模型的“智慧”主要体现在若干水力学公式上,计算机将公式运用到拓扑上,通过率定手段矫正公式或者拓扑。因此这些公式实际就把所有运用到系统中的“智慧”都囊括了。这势必要求计算条件要符合公式的前提假设,因而太理想化。率定方法可以根据事实去调整公式或拓扑,但这种方法一来意味着它是根据当前的情况去调整,二来假定公式或拓扑有可调整性。前者的问题是:情况在不断变化,一次性的率定可能很快就失效了。补救措施是自动地持续率定,这就要求公式或者拓扑是具有可持续率定的稳定性的。这个假设是否成立,需要时间检验,需要事实考验。但无论如何,“智慧”来源单一、高度浓缩,是这类方法的先天缺陷。除了教科书上的教条,知识还来源于一线业务员们积累的经验,来源于数据挖掘,来源于网络的离散的文本,来源于各种其它业务系统——比如用户的投诉、管道的养护等等。传统商业智能同样如此,当我们津津乐道于“大数据”的时候,往往忽略了“大数据”只是提供了丰富的事实材料,却没有持续地提供足够的业务“智慧”去处理事实材料。
2.“智慧”的即时性强而缺乏传承
人的智慧是通过一代代传承而不断累积改进的。但过去的技术并不珍惜“智慧”。要么像公式那样只跟当前的状态有关,要么像挖掘所用的业务规则那样认为业务亘古不变,这些都是有问题的。即时性的“智慧”只能在那些马尔可夫假设成立的领域里使用。那么,管网的运行是否符合马尔可夫假设?这似乎也需要时间和事实检验。在传统行业中,“传承”是一个特别重要的能力,工匠们将自己的经验传承给继承者,这个智慧是不断累积的而不是断代式、突发式地凭空创造出来的。供水生产需要积累调度经验,供水营销需要积累用户关系,整个运营是不断累积经验的。
3.可持续改进性低
由于“智慧”的来源单一、即时性太强,因此就衍生出第三个问题:可持续改进性比较低。“质量”是产品本身而不是产品的一个属性,质量无法持续改进的产品,是没有生命力的产品。持续地率定能够部分地弥补这样的问题,但是方法的单一性会导致风险。比如自动率定是否能保证它的收敛性?人工率定如何保证持续性?并且最根本的问题是,理想化设定往往会无视显而易见的重要问题。比如管道工程需要区域性地停水是常见的情况,这其中既有暂时性的影响(施工停水),也有长久性的影响(新管道引起拓扑变化),那么这种理想化条件的“干扰因素”如何予以快速而持续的应对呢?
三、传统的解决方案
针对这样的问题,传统的计算机解决方案主要有知识管理系统KMS、人工智能的专家系统等等。
在我看来,KMS主要有两点问题:
(1)存储的是人的智慧而不是计算机的“智慧”
KMS是使用计算机存储组织过程资产(比如各种文档、人员经验等)的系统,新型的云存储扩展了KMS的远程化能力。但在KMS中所存储的内容,主要还是人的自然语言,而不是计算机的规范化语言。因此即便新型AI能在一定程度上处理离散文本,它的主要精力仍然没有放在处理专业内容上。这样的KMS只会积累了一大堆只有人能看懂的知识,无法用计算机直接处理。
(2)无边界性
建设KMS系统很容易陷入“坑”里,因为编写的知识无边界性。知识写得太深入徒增成本,写得太浅没有价值,写得太专业应用得少,写得太泛无法运用。因此建设KMS时要对条目预先进行条件约束,而计算机规范化就是这样的一类约束。为了达到效果,应在约束条目时就预先筹划好未来如何运用条目——要注意是对运用条目进行筹划,而不是对未来的业务筹划。企业常常制订各种“规划”,这些规划是业务性的。对技术的规划不能脱离业务,但不能仅仅是业务,否则往往最终成果无法计算机处理。
传统专家系统提出以知识库存储专家知识,以逻辑推理机将事实数据与知识库相结合推论出结论来支持决策。但是这类系统问题可能如下:
(1)知识表达的要求太严格
知识库中的知识条目可以用产生式(从前件可得到后件)或谓词逻辑、框架式(为知识设定若干框架,然后将知识纳入框架中)、语义网络(类和对象的表示法)、过程式、特征表等等,不可谓形式不丰富。问题在于往往只能使用一种表达方式,这就限制了知识来源的多样性。如果水力模型研究了那么多年,高度浓缩了专家智慧的公式却无法用于逻辑推理的系统,这是非常浪费的。
(2)知识条目无评价
知识条目都仅仅是理论教条,它们需要通过事实来检验,否则会过时、脱离实际。各种率定方法、采用率的评分、反馈,实质就是要让这些条目得到评价而获得更新。传统专家系统的问题,就是“重建设而轻管理”,将主要精力放在了技术上知识库与推理机如何实现推导,而没有重视知识循环。
四、以知识管理为核心的软件体系
解决方法是结合KMS与专家系统形成的框架,如图1所示。既要管理知识,又不能无约束地编写知识,而是要预先筹划这些知识如何运用。管好才能用好,“管好”需要朝着“用好”去管,二者是互生互动的关系。
值得注意的是,筹划并不等于设计。例如:对于未来筹划要分析调度的特定动作会对供水压力、电耗、取供比、缺水投诉率等指标有何影响,可以针对调度指令动作进行筹划,将调度指令规范化为各种选项的组合。但是此时并不涉及到如何分析这些选项内容的问题。因为要分析这些选项,既可以是以统计的算法计算动作与事实数据的相关性,也可以是采用谓词逻辑的方式来演绎逻辑结果,还可以用水力模型去模拟这些选项会造成何种影响。因此筹划的重点是如何约束知识,并不需要马上针对特定算法进行设计。
图1 以知识管理为核心的软件体系示意图
图1中,虚线框内是核心的知识管理部分,包括规范化的知识库和多维度代理机器人两个部分。多个知识来源须按知识规范输入知识到知识库。知识规范体现的就是对知识进行筹划的成果,负责为知识内容提供规范化形式,从而约定语义。这样代理机器人就用它去翻译知识。另一部分是存储结构,规定了知识表达的语法。
代理机器人是一种中介,它负责按知识规范解释知识,为推理机提供内涵。由于知识来源(知识输入源)、立场(从专家、领导、客户、中介等不同角度)、表达形式(公式、谓词、过程描述、产生式、框架、语义网络等)、可靠性(评估知识条目的结果)、影响力(知识的权重)、主题相关性(关键词、主题词的关联数量)等具有多样性,推理机算法也具有多样性,因此代理机器人是多维的。比如在推理机用聚类算法分析用户行为,就调动属于聚类算法和分析行为这两个维度的那些代理机器人(包括各种表达方式、立场、知识来源)来进行推理。这就综合运用了多种表达方式、多个立场、多种知识来源。
结合内涵知识和外延事实来推理结论,其实水力模型也是这样的过程:比如伯努利方程可视为流速(瞬时流量)与压强(供水压力)关系的知识。那么采集到的具体流速或压强就是外延事实,两者结合起来就能从某监测点采集到的瞬时流量推论出供水压力,或反之。
使用推理机进行计算时,事实数据并不一定像伯努利方程的例子那样能直接利用。比如对谓词逻辑,还需要模糊逻辑将具体数值翻译为“高/中/低”这样的陈述。那么执行这种翻译操作的就是规则翻译代理机(实际上也是一个代理机器人)。因为内涵与外延在后来要通过推理机进行结合,因此这种翻译要与知识规范相对应。
推理机得到的结果还需要解释器进行翻译。推理机只是负责得到结论,而解释器是运用结论。比如调度方案通过这么多结论进行选优(决策支持)、或者将这些结论以报表展示、或是按统计方法聚合这些结论(数据挖掘)。解释器的部分结论是可以作为新的事实反馈回原始数据区(即将解释器本身视为业务系统)。“最终结论”本身又可以成为知识来源。
为了体现知识的更新,通过解释器得到的“最终结论”都需要通过评价器估算其质量。这种质量主要就体现在可靠性或稳定性上。评估的结果会改变知识库(比如给每一个条目以可靠性程度指标)和推理机(比如对每种算法以评估以对比优劣),从而影响下一个计算循环(比如在算法中加入可靠性因子,可靠性程度高的知识赋予较高权重)。
五、此体系的优缺点
1.优点
●涵盖了现有的多种方法,通过剪裁就可以灵活地实现为现有的任何一种技术体制,同时又可以综合运用不同技术体制的能力。
●多维度地运用知识和事实,弥补单一维度技术体制的缺陷。
●为“智慧”的传承提供了载体,为“反思”知识提供多种途径。“智慧”可继承,可迁移,有评价。
●编写知识条目有依据有边界。各种周边系统就可根据知识规范展开建设。
2.缺点
●体系过于复杂,实现成本较高,适合逐步建设完善。
●“智慧”的成熟比较慢,需要较长的时间持续优化。
●收敛性未知,多种决策体结论有可能是冲突的。
六、总结
哲学家迦达默尔说:“凡是在某种东西能被我们所产生并因而被我们所把握的地方,存在就没被经验到,而只有在产生的东西仅仅能够被理解的地方,存在才被经验到”。业务系统所把握的细节数据并非“智慧”,“智慧”存在于对数据的理解、抽象。“智慧水务”的各种周边业务系统得到的是“智慧”的表象,只有将其进行理解、运用、管理起来,才是真正的“智慧水务”。之所以要以知识管理为核心,正是基于这样一种认识。
需要注意的是,这里所探讨的软件体系,是一种环境,而不是工具,是“智慧+”,而不是“+智慧”。但是计算机确实又是一种工具学科,IT所做的事情是建立这样的工具。于是营造这样的环境就需要IT人与传统行业的业务人一起共同努力。因此“智慧+”就不是IT人自说自话能够完成的,它必须和业务本身完全结合起来,否则始终只是随时能被牺牲掉的工具。反之,这也不是业务人能自说自话的,否则业务根本不会发生变革——正是那些能够由业务自行变革获得的红利已经耗尽,才需要IT技术发展带来的新机遇。因此以知识管理为核心的软件体系,IT人与业务人的工作都是缺一不可的。
参考文献
1.Q Zhou,D Chen,A Logic Based Framework for Multi-Objective Decision Making,Springer Berlin Heidelberg,2013,181:961-966.
2.王万良,《人工智能及其应用》,高等教育出版社,2008年.
3.李东,《决策支持系统与知识管理系统》,中国人民大学出版社,2005年.
官方微信
官方抖音
智能客服
返回顶部