东北石油大学学报
主办单位:黑龙江省教育厅
国际刊号:2095-4107
国内刊号:23-1582/TE
学术数据库优秀期刊 《中文科技期刊数据库》来源期刊
       首 页   |   期刊介绍   |   新闻公告   |   征稿要求   |   期刊订阅   |   留言板   |   联系我们   
  本站业务
  在线期刊
      最新录用
      期刊简明目录
      本刊论文精选
      过刊浏览
      论文下载排行
      论文点击排行
      
 

访问统计

访问总数:14650 人次
 
    本刊论文
基于多层次业务流程的石油勘探开发领域本体库的构建方法的探讨

  论文导读::本体论与各个领域计算机技术的发展结合产生了所谓的“领域本体”的构建及应用研究,本文首先从石油勘探和开发领域当前计算机技术的问题出发,提出基于多层次业务流程的石油勘探和开发领域本体库的构建方法,把石油勘探开发领域所涉及方面分为多级业务活动层次,并以圈闭活动为例列出了对应的微本体库构建方法的探讨。

  论文关键词:本体,领域本体,石油本体,业务流程构建本体,微本体

  0 引言:

  随着石油勘探和开发的深入和科学技术的不断发展,互联网的广泛普及,各种相关信息量极大的丰富,交叉学科知识的增长与更新速度日益加快,为石油勘探和开发领域知识构建带来复杂的问题。石油勘探和开发领域包含勘探、测井、钻井、录井、试油、井下作业、采油工程、石油储运等二十多个专业,这些专业相互协同,构成石油勘探与开发的全部业务流程。但是在专业之间普遍存在着系统独立开发、单纯追求功能实现,没有从整个石油行业的高度来规划各种石油勘探开发应用系统的设计和开发使用,使得从调研确定需求阶段开始到组织管理数据等多方面造成了对各专业知识的不一致理解和使用,导致了各系统之间对信息、知识共享的障碍,无法为石油勘探和开发领域提供完善的全局解决方案,以中国石油天然气集团公司为例。在中国石油天然气集团公司信息系统数据库建设十几年中,依然存在以下一些问题[1,2]:

  (1)编码原则不统一,基础数据情况不佳。

  主要体现在:早先按专业垂直建立的各个信息模块基本上都有自己的基础数据,数据繁杂而且量大,部分数据不够准确、完备。同时,由于时间和技术的局限性,企业在各个不同历史时期所开发的应用系统相对独立,系统之间无互联性,描述企业信息资源的数据和编码分散、口径不一致、冗余、不规范,有时同一数据或数据指标在不同的系统、不同部门以不尽相同的描述和内容表现出来,使得油田资源无法充分有效地共享。

  (2)信息系统和软件存在重复开发现象。

  目前,中国石油用于信息化建设的投资和参与信息化建设的人员都具有一定规模,开发完成了一定数量的信息系统和应用软件,并取得了一批研究成果毕业论文题目,其中部分系统和软件达到了较先进的水平,但低水平重复开发现象严重,因为在中国石油产业重组改制以前,各家单位都各自为政,都在投资开发自己的系统,这不但造成了资源的很大浪费,而且严重地阻碍了信息化进程的发展。

  因此从长远看石油勘探和开发领域全局知识的构建已成为一种趋势,从知识的角度对石油勘探开发资源进行统一综合管理和决策,建立石油领域的本体库成已经为石油公司建立竞争优势必备的环节。

  1 本体

  1.1本体论及领域本体的基本介绍

  本体论(Ontology)概念起源于哲学领域;在计算机学科的使用可以追溯到上世纪80年代,最终Gruber给出了广泛接受的概念[3-5]:本体是概念化的明确的规范化说明。

  本体作为一种知识共享模式,为特定领域的人和应用系统的交流提供了极大的便利,也正因为如此,本体的研究和应用迅速延伸到知识工程、自然语言处理、信息检索系统、智能信息集成和知识管理、信息交换和软件工程等领域。而如何对这些不同领域内的知识进行抽取和描述并构建出合适的领域本体已经成为当前的研究热点之一[6-8]。

  所谓领域本体(domain-specificontology)是对学科概念的一种描述,包括学科中的概念、概念的属性、概念间的关系以及属性和关系的约束。由于知识具有显著的领域特性,所以领域本体能够更为合理而有效的进行知识的表示。领域本体一般用来表示某一特定领域范围内的特定知识,以本文为例即研究石油勘探开发领域本体库的构建方法为主要内容。

  1.2本体的结构:

  作为不同主体之间进行交流的一种语义基础,本体由描述某种现实情况的特定术语集,加上一组关于术语内涵意义的显式假定集合所构成。在最简单的情况下,本体只描述概念的分类层次结构:在复杂的情况下,本体可以在概念分类层次的基础上,加入一组合适的关系、公理、规则来表示概念之间的其它关系,约束概念的内涵解释。一个完整的本体应由概念、关系、函数、公理和实例五类基本元素构成:

  (1)概念是广义上的概念,除了可以是一般意义上的概念以外,也可以是任务、功能行为、策略、推理过程等。本体中的这些概念通常构成一个继承的分类层次。

  (2)关系是领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集: 。在语义上关系对应于对象元组的集合。

  (3)函数是一种特殊的关系,n元函数中的第n个元素由前面n-1个元素惟一确定,形式化的定义为:微本体。

  (4)公理是一些永真式的描述。更具体地说,公理是领域中在任何条件下都成立的断言。

  (5)实例是指概念中的具体例子,特定领域的所有实例构成领域概念在该领域中的值域。

  2 业务模型的介绍:

  石油业务模型(Business Model)是一种通过定义组成活动及活动之间逻辑关系来描述石油企业经营生产过程的模型,它是勘探开发数据模型的基础论文服务。

  业务领域的划分以某种与石油相关的主题为指导从整体上对油田主要业务进行划分。它不是现有机构部门的照搬,也不是基础业务的整理,而是概括的,总结性的划分。

  2.1业务领域及业务划分方法

  按照业务管理形式或油田生命周期组织方式进行划分,例如按照业务管理可划分为“勘探、开发、生产、经营”4大类。具体方法是:首先根据专业划分业务域。某一专业在油气田勘探、开发中承担了某一确定领域的业务,具有明晰的业务边界。如“物化探”、“钻井”、“采油”、“分析化验”等,不同专业间具有明显不同的业务范畴和业务特性。其次根据油气田勘探、开发生命周期划分业务域。油气田勘探、开发存在着明显的阶段性,且有较明显的阶段性标志,如勘探阶段、开发阶段、废弃阶段等,同一阶段内的若干子业务往往具有一定的相关性,如钻探阶段中的钻、测、录、试等。最后根据油气田勘探、开发管理阶段划分管理业务域。针对油气田不同生命周期或阶段,存在着一些重要的阶段性管理业务。其油气田管理手段和管理方式都不相同,管理内容也不相同,如勘探规划部署阶段、勘探综合研究阶段、开发部署规划阶段等。管理业务可能集中于勘探、开发一个或几个阶段,也可能贯穿于勘探、开发的全过程。

  2.2业务领域划分

  业务域的划分以方法生命周期为主线,将专业业务域与方法管理业务域有机的串接起来,尽量符合油气田勘探、开发管理的约定俗成的管理习惯,做到不同业务域间的业务不重复,并保证能覆盖所有的勘探、开发业务。

  根据以上原则和方法,把油气田勘探开发业务划分为“勘探规划与部署”、“物化探”、“井筒工程”、“分析化验”、“综合研究”、“开发规划与开发方案”、“油气生产”、“油气集输”等8大业务域。

  2.3业务活动划分

  业务领域中包含独立的一个个业务和更细的子业务。每个业务包含该业务的业务流程,业务流程中包含更细的、小的子业务流程。按照同样的原则毕业论文题目,可以将业务逐级细分下去,直至不可细分的业务功能单元为止,称为业务活动。

  大的业务包含更小的子业务。按照同样的业务划分原则,可以对业务继续细分。业务的划分要覆盖业务领域中的全部业务。直到将该业务领域中的业务全部细分出来为止。业务域-业务-业务流程-业务活动的层次要大于等于三级,业务域-业务的划分和业务流程的分级都不超过三级;如果确实超过三级,则向上一级压缩,或重新规划分级层次。

  以“综合研究”业务划分为例,如图2-1所示,首先,综合研究在整个勘探开发生命周期处于勘探的中后期阶段,也是一个关键性阶段,它的专业特点很突出,产生大量的大块数据和成果文档,因此把“综合研究”作为一个顶级业务域对待。它下面包含五个一级业务:“构造研究”、“资源评价”、“油藏描述与评价”、“剩余油研究”和“油藏数值模拟”;而以其中的“资源评价”为例,它又包含:“盆地评价”、“区带评价”、“探井评价”和“预测储量计算”四个二级业务;其中“区带评价”又包含五个三级业务活动:“烃源岩条件评价”、“运聚条件评价”、“储层条件评价”、“保存条件评价”和“圈闭条件评价”。(注:F/S表示上下位关系)

  微本体

  图 2-1:业务活动分级图

  3 基于业务活动的本体模型

  3.1 业务活动划分

  业务活动是业务流程分解后最基本、不可再分解的最小功能单元。一般来说,一个业务流程包括若干个业务活动。业务活动的划分与业务分析的视角有关。

  业务活动描述:对业务活动的文字性概要描述,描述按照“6W”的模式进行描述,即活动是由谁(Who)发起的、在什么时间(When)发起的、在哪里(Where)发起的、为什么(Why)要发起这个活动、在这个活动中都涉及到了哪些(Which)对象、这些对象的特性是什么(What)。通过这个“6W”过程,可以将某一业务活动中涉及的相关信息完全抽取出来。

  6W的核心实质是“对象-活动-关联-特性”,如图3-1所示。

  微本体

  图3-1:APO业务活动建模框架

  3.2 业务单元的原理

  一个业务单元(Business Unit)是在实际勘探开发生产过程中可独立组织实施的不必再分的最小业务活动及相关环境。业务单元涉及的业务规则、活动、各种对象(活动执行者、活动作用对象、活动参与对象、活动结果对象)及其相关特性和相互间关系等称为业务要素,描述业务要素定义及业务要素之间关系的模型称为业务要素模型。在本文中,描述业务要素的类和属性都采用数据元的定义,因此业务要素模型也称为数据元素模型,即数据元之间的关系。

  一个业务单元包括以下8类要素:

  1.一个业务活动。

  2.该活动作用的一个业务对象。

  3.实施该活动的组织机构。

  4.一组结果对象(输出)。

  5.一组参与对象(输入)。

  6.以及该业务单元的业务规则,即实施该活动的条件与约束。

  7.相关对象的特性。

  8.对象之间的关系。

  八类要素之间的关系如图3-2所示。

  图3- 2:业务单元体系结构

  定义业务单元有以下两个作用:

  在进行业务分析时,作为业务定义和划分的基本单元,用于对业务进行细化,是进一步定义数据元及数据元素模型的依据。概念层的业务单元描述了业务的现状,描述粒度比较粗,特别是对数据与主体对象的关系,而实际上数据可能是构成主体对象的组件对象的特性。例如,一次测井施工数据应该是与一个井筒段相关的,但在业务单元中可能只定义与井相关,而不关注井筒段这个对象。因此需要进一步的细化工作。

  在设计逻辑数据模型时,逻辑层的业务单元是一组业务对象和特性的集合,给出了定义逻辑数据模型的基类,直接缩小了选择对象的范围,业务单元的约束条件使数据的语义明确清晰。

  3.3 业务单元的设计

  设计业务单元的基本原则是与业务模型及数据元定义保持一致。

  1.从业务模型中提取一个过程的业务要素。

  2.按数据元的定义对各要素进行规范化定义。

  3.将业务规则按约束条件公式化。

  4.按模板定义业务单元字典。

  5.按模板设计关于该业务单元的类图论文服务。

  业务单元模板如表3-1所示:

  表3- 1:业务单元模板表

  编号

  业务单元

  业务

  要素

  业务要素类别

  数据元素模型对应实体

  数据项名称

  数据项代码

  单位

  数据项标识

  数据项表达式

  数据项映射路径

  操作

  操作约束

  数据项约束

  业务单元约束

  3.4业务单元的类图

  业务单元的映射可以与数据元的映射统一起来,在业务规则中对约束实体及一些中间实体、纽带实体等进行描述。编写一些小的工具,可以将两者相互转换,或对两部分的成果进行校对,检验一致性和正确性。

  为了比较直观地理解业务单元的内容,在完成业务单元字典的定义后,还需要绘制业务单元的类图。

  类图的作用:

  1.可以作为检查映射结果的工具,如果通过映射得到的数据元素及其关联关系在类图中无法表示出来,那么说明映射的结果存在问题。

  2.便于理解,从类图中可以清晰、直观的看出一个业务单元里包含的所有数据元素及它们之间的关系。

  3.为未来本体库应用开发提供参考。

  图3- 3:业务活动基本结构类图

  4 以圈闭活动本体构建为例:

  4.1:微本体模型

  石油勘探开发领域本体模型给出了在该领域内利用本体组织知识、表示知识、应用知识的逻辑形式。勘探和开发领域本体Pet-On可以形式化地表示为五元组Pet-On=<O,C,R,At毕业论文题目,Ac>,其中O是论域,即本体的集合,C是论域E中的领域概念或术语的集合,R是本体之间的关系,At是本体的属性,Ac是本体的活动或操作。具体的微本体模型如图4-1所示:

  图4-1:业务活动本体模型图

  O:论域。根据勘探开发领域知识粒度的不同,论域O中的本体分为不同的级别。一级对应领域主题,如勘探井位部署;二级对应构成一级本体的最大粒度的知识,例如烃源岩;其它级别本体划分方法依次类推。

  C:概念或术语。根据勘探开发领域知识粒度的不同,概念或术语的粒度也不同。通常情况下,概念或术语也就是相应本体的名称。例如,勘探井位部署是一级本体名称,同时它也是领域概念的名称。但是,二者有着完全不同的含义。作为本体,勘探井位部署有着自己的属性、活动和与其它本体之间的关系。作为概念,勘探井位部署没有活动,也没有属性,但是有与其它概念之间的联系。

  R:本体之间的关系。可以是构成关系,继承关系,也可以是作为其它本体属性的关联关系。

  At:本体属性。例如圈闭的等级,烃源岩的丰度。

  Ac:本体活动或者操作。例如,构造评价就是构造本体的活动。

  4.2:圈闭活动的本体模型构建

  一个专业领域的本体模型首先必须确定一个业务关键词汇之间的关系等,就形成了一个完整的领域本体模型。

  圈闭活动微领域本体的构建模型如图4-2所示。

  5 总结:

  本体库的构建是一个浩大的人工智能系统工程,领域本体的构建与应用又是其中最有广阔发展前景的方面,本文提供了一种基于业务流程的多层次本体构建方案探讨。可以预见:在不久的将来领域本体库的构建与应用会对人类社会的进步作出巨大的贡献。

  参考文献:

  [1]陈新发,曾颖,李清辉。数字油田建设与实践-新疆油田信息化建设[M].北京:石油工业出版社,2008.27

  [2]汪福勇,李爱国。浅谈中国石油信息标准化[J].石油工业计算机应用,2005,13(1):2-6.

  [3]Thomas RGrube. Ontolingua:A Translation Approach to Potable Ontology SPecification.Knowledge Acquisition,1993,5(2):199-200.

  [4]Bomt W N.Construction of Engineering Ontofogies for Knowledge Sharing and Reuse[D]. PhDThesis,Enschede:University of Twente,1997.

  [5]Fridman Noyand CD Hafher. The State of the Art in Ontology Design. A Survey andComparatlve Review. AI Magazine,1997:53-74.

  [6]陈刚,陆汝钤,金芝。基于领域知识重用的虚拟领域本体构造。软件学报,2003,14(3):350-355.

  [7]冯志勇,李文杰,李晓红。本体论工程及其应用[M].北京:清华大学出版社,2007.

  [8]袁国铭,李洪奇。关于决策支持系统的综述。微型机与应用[J].2010,29(23):5-7.

  [9]Fridman Noy and CD Hafher. The State ofthe Art in Ontology Design. A Survey and Comparatlve Review.AIMagazine,1997:53-74.

  [10]Guarino N.Formal Ontology and Information Systems. In: Proceedings of the lstInternational Conference on Formal Ontology in Information Systems(FOIS’98)。Trento,Italy:IOS Press,1998,3-15.

  [11]Quine W V.From a logical Point of view: Nine Logico-philosophical Essays,Cambridge, Massachuetts ,USA:Harvard University Press,1980.

  [12]Guarino N,Carrara M,Giaretta P.Formalizing Ontological Commitments. In:Proceedings of 12thNational Conference on Artificial Intelligence(AAAI’94)。Seattle,Washington,USA,1994.1:560-568.

  [13]邓志鸿,唐世渭,杨冬青等。本体内代数系统之研究。计算机工程与应用。2001.7(23):7-8

  [14]Peter Mika. Ontologies are us: Aunified model of social networks and semantics [J] .Web Semantics: Science,Services and Agents on the World Wide Web, 2007, 5 (1) :5-15 .

  [15]杨义忠,王承勇,林淑凤。石油主题词表。石油工业出版社,1994.

  [16]刘宝和。中国石油勘探开发百科全书。石油工业出版社,2008.

  [17]袁国铭,李洪奇,樊波。关于知识工程的发展综述。计算技术与自动化[J].2011,30(1):138-143.

特别说明:本站仅协助已授权的杂志社进行在线杂志订阅,非《东北石油大学学报》杂志官网,直投的朋友请联系杂志社。
版权所有 © 2009-2024《东北石油大学学报》编辑部  (权威发表网)   苏ICP备20026650号-8