您的当前位置:首页正文

POSC数据模型与我国石油工业数据标准化

2021-12-29 来源:好走旅游网
POSC数据模型与我国石油工业数据标准化

袁 满 yuanman@263.net

(黑龙江省 大庆市 大庆石油学院 运算机学院)

1 前言

随着运算机的普及,专门是随着运算机网络技术的进展,为石油工业的现代化治理

提供了基础保证平台。这一基础平台为石油工业进展的信息化、治理的现代化提供了优越的环境,而信息化的前题是数据的标准化,只有实现了数据的标准化,才能实现石油工业中各企业间信息的共享,才能使治理现代化。只有对石油工业数据标准化,才能够实现数据交换的标准化。在世界上,石油工业数据的标准化,不只是我国一直在从事这方面的研究,国外一些闻名的大公司与相关的组织也一直在从事这方面的研究。

1990年,美国的BP Exploration、Chevron Corporation、Elf Aquitaine、Mobile Copoartion及Texaco Inc等五大石油公司联合发起并成立了POSC组织,该组织是目前最具权威的一个石油数据标准化组织。它定义的数据模型从1.0、2.0、2.1、2.2一直进展到今天的到3.0规范,在那个规范的进展中,使那个通用模型日渐成熟。整个模型的定义反映了石油勘探与开发中各种业务关系及技术关系。

通过总结与精炼,我们给出了POSC数据模型核心精深理念:“对象-活动-关联-特性”思想。不管是模型的建模理念,依旧模型本身的组织思想关于我国石油数据标准化具有深远的理论与应用上的指意义。

本文对POSC数据模型精深理念进行了详细的剖析与论述,旨在使这种思想关于我国石油数据标准化能起到一定的指导作用。

2 6W模型、对象及特性

2.1 6W模型

对象的概念是一个广义的概念,它可能包括具体对象,也可能包括抽象对象。对象是由活动产生的,例如一口井,它是通过钻井活动产生的一个对象。因此在那个地点我们提出与传统观念相反的概念,即认为数据是以活动为中心的,而不是以对象为中心的,对象间的作用产生了活动,而活动又产生了新的对象与特性。

同样,特性的作用,通过研究认为:数据有两个要紧的的作用,一个是用来描述对象本身的静态特性,即描述对象不变属性的那些特性,如一口井的编号、位置等信息,这部分特性以对象为中心;而另一部分是用来描述对象与活动相互作用而产生的过程特性,即对象的动态特性。以活动为中心,在活动中既产生了特性,又有可能产生一些新的对象。

在电信领域有人提出了描述业务活动的5W模型,这一模型具有通用性,基于这一模型,我们提出将油田整个活动的生命周期中涉及的业务抽象为一个“6W”模型,即某个活动是由谁(Who)发起的、在什么时刻(When)发起的、在哪里(Wherer)发起的、什么缘故(Why)要发起那个活动、在那个活动中都涉及到了哪些(Which)对象、这些对象的特性是什么(What)。通过那个“6W”过程的提问,能够将某一业务活动中涉及的相关信息完全抽取出W来,见图 1。

活动的发起者以及涉实际上,在我们日常的生产W及到的相活、起结关人或组织动也发发及间用括可起W与治理过程中,每天都在有目的动续时的活的活持束地动能包位地从事着各种有规规律的,甚至)点作置活识起(特是重复的活动。这些活动既包括发的标性中动目的记产活W活的动录生动过W的生产活动,又包括治理活动,而活动中所涉及程的对象,包括每一种具体的活动都有其描述的新产生的对象W特性。我们认为对象是为活动服图 1 在一个活动生命周期中涉及的6W模型务,活动的过程不是目的,最终

是通过这些活动来达到某种目的。因此活动本身象一个胶水,它临时将一些相关对

象粘合在一起,由这些对象的联合作用完成一个活动。

2.2 对象、活动、特性及关联关系

在一个活动的生命周期中,一个活动可能会涉及到若干个对象,同时该活动也可能

会产生一些新的对象;通常情形下,一个大的活动可能要由若干个子活动组成;特性是对对象、活动、对象与对象间的临时关系、对象与活动间的临时关系及活动与活动间临时关系的描述。一个活动中涉及的特性包括:描述对象本身的静态特性一、对象与对象临时关系特性一、对象与活动临时关系特性以及活动与活动临时关系特性一。它们间的关系见图2。

对象间建立临时关系Object活动象可对,能述下性对活描用特象动会来作的与涉产的生活及生性特动产动到对活象对象由间在对建象立临时关Property系Activity活动包含子活动由特性来描述活动活动间建立由活动产生特性临时关系图 2 对象、活动及特性间的关系 一个大的活动可能要分成几个子活动才能完成,而每个子活动与大活动具有相似

性。每一个子活动可能又有几个子子活动组成,每个子子活动又会产生新的对象或特性。图3表示了一个活动通常是由n个子活动组成的,每一个子活动中可能会涉及一组对象,这些对象间相互作用可能会又产生一些新的对象。图3中的圆表示该子活动所涉及的对象,这些对象可能是原先就存在的,也可能是由该子活动产生的。

OOOOOOOOOOOOSub_Activity1Sub_ActivityiSub_Activitynt图 3 一个活动通常是由若干个子活动组成的从图3中还能够看出,一个活动通常是按照活动的进度表来进行的,每一个子活动进行时必须遵循该子活动的模板,随着时刻的向前推移,这n个子活动在逐步进行,直到每一个子活动完成了,这一大活动才被完成。

对象、活动、特性及关联关系在数据建模中占有专门重要的地位,下面我们对它们进行一一讨论。

对象的分类定义

高层分类

POSC将对象分成了两大类,一类是与技术有关的技术对象,另一类是与业务有关的业务对象,见图4。

3 3.1 Object_of_InterestTechnical_ObjectBusiness_ObjectToplogical_ObjectDocument_SpecificationLocatable_ObjectSpatial_ObjectInterpreted_FeatureFacilityEarth_FeatureMaterial图4 对象分类 在油田勘探、开采等活动中涉及的对象相当繁多,其中的业务对象关系既包括了拓

扑对象,又包括了文档规范对象;而拓扑对象又细化为可定位的对象与空间对象,那个地点的空间对象要紧包括点、线、面、体等。可定位的对象既包括了由地震说明所获得的地质特点对象,同时又包括了对井筒中地质特点的说明对象,地球特点又包括若干个用来描述地球特点的对象。

3.1 材料对象的分类

图 5给出了POSC数据模型中关于材料的分类。这一材料对象模型包括了油田中所涉及到的各种材料对象。

图 5 材料对象的分类从图 5能够看出,材料对象包括了生产中使用的设备、岩石材料及各种流体材料,同时将文档也归结到材料对象模型中去了。

3.3 通用设施对象分类

从图 4中还能够看出,在油田的整个生命周期中广泛使用的设施(Facility)属于可

定位对象。该对象又是由若干个对象组成的,其中占有专门大比例的对象是通用设施对象(General_Facility),它包括的对象见图 6。这些设施要紧是指地面上的一些设备,并不包括井筒中的一些设施。

图 6 通用设施对象分类在通用设施对象的分类中包含了油田生命周期中涉及到的各种地面设施。

3.4 井筒中设备对象的分类

不管是生产井依旧注入井或者是其它类型的井,为生产或测试的目的,在井筒中安

装了许多的设备,如在机采井中安装了抽油杆、抽油泵、各种阀等。这些井下设备对象的分类见图 7所示。

图 7 井筒中设施对象分类3.5 描述对象的属性

通过上面的讨论可知,对象之因此存在千差万别,是因为不同类别的对象具有不同

的属性,因此POSC的数据模型对每一个对象均定义了描述其特性的属性。例如同是属于材料(Material)对象中的岩石样本的岩芯(Core)与岩石薄片(Rock_Thin_Section),它们除了从它的父类岩石样本中继承了通用属性之外,还各自定义了它们相区分的属

性,如Core定义了wellbore属性,以说明它是取自于哪一口井;而Rock_Thin_Section对象定义了sample_thickness属性,以反映该岩石薄片的厚度。不同的类型的属性描述对象不同方面的信息,如拓扑属性能够描述该对象与其它对象间的拓扑关系。

在POSC数据模型中,从不同的角度定义对象的属性,以实现从不同的方面描述对

象的目的。

3.6 关于对象分类的总结

为描述石油勘探与开发中的各种活动,POSC定义了丰富的对象。在上文中,我们通

过对对象分类的讨论可知,在POSC中,对各种类型的对象采纳科学的方法进行了细致的分类。能够清清晰地看出在POSC数据建模中涉及的差不多原子对象确实是如此各种类别的对象。而POSC对这些对象进行了明确的定义,并对描述各种类别对象的属性进行了定义。因此在一个具体的活动中,实际参与的是一些对象的集合,这些对象既包括了技术对象,又包括了各种业务对象,是这些对象相互作用的结果才完成了某一活动。

4 活动的分类定义

4.1 活动的分类

POSC在2.2版本中,对活动进行了分门别类的定义,即活动(Activity)定义了若干

种子类实体,而到了3.0版本只定义了一个实体Activity。为了反映不同的活动类别,在Activity实体中通过属性kind来标识该活动属于哪一种类型。POSC将油田生命周期中的活动从大类上定义为:井筒活动、电缆地层测试活动、瞬时压力测试活动、油藏摸拟活动、定向勘测分析活动、泥浆分析活动、矿物表征活动、流体分析活动、地学说明活动、材料处理活动、生产活动、样本采集活动等。

4.2 描述活动的特性

通过上面的讨论可知,活动也是由特性表征,为此我们将描述活动的特性总结在表

1中。

表 1 描述Activity的显示属性 属性名称 类型 含义 Identifier StringElement 活动标识 Description StringElement 对活动的描述 instance_create_date TimestampElement 实例创建时刻 instance_creator StringElement 活动的发起者 last_updated TimestampElement 活动的最后更新时刻 last_updated_by StringElement 活动的更新者 Source StringElement 该活动数据的提供方 activity_context IntanceElement 描述活动的环境信息 Containg_activity InstanceElement 所包含的子活动 Cost MoneyElement 活动所花的费用 start_time TimestampElement 活动开始的时刻 Duration QuantityElement 活动连续的时刻 end_time TimestampElement 活动终止时刻 Kind InstanceElement 活动的类型 ref_existence_kind InstanceElement 活动正在进行或打算中 ref_transient_period InstanceElement 活动的周期 naming_system InstanceElement 活动命名所遵循的规则的定义机构

除此之外,它定义了一些反映与该活动有关的一些逆属性,逆属性通常是该活动涉

及的一些其它对象实例,通过逆属性的形式,POSC的数据模型将活动中涉及的一些相关对象捆绑在一起。例如,那个地点的属性involved_object属性是activity的一个逆属性,它是一个集合的类型,其中集合中的元素是若干对象实例,由该属性定义该活动中涉及的各种对象。

5 关联关系

活动中会涉及若干个对象,这些对象之间或者是对象与活动之间等都有可能建立临时关系,例如在完井活动中一个完井段与某一井筒建立的临时关系以及在作业活动中主方与承包方间的临时关系或者是某一设备与另一个设备间的临时联结关系等。

在POSC数据模型中,以活动为中心将相关的对象组织在一起,这些对象之间可能会

建立临时关系,也可能建立永久关系。这些不同对象间的相互作用便导致了相应的活动。POSC中的关联关系由Association与Transient_Association来描述。

6 特性模型

在POSC数据模型中,特性数据模型与对象、活动等捆绑在一起,用来描述对象的

静态与动态特性。在POSC的Epicentre 3.0版本中定义了395个特性实体,例如仅密度一项就定义了几个不同的密度:Pty_liquid_density、Pty_solid_density、Pty_density_molar、Pty_bulk_density、Pty_charge_density、Pty_critical_density、Pty_current_density、Pty_current_density_linar、Pty_density_vapor、Pty_matrix_density、Pty_reduced_density、Pty_saturated_bulk_density等。POSC为了满足扩充性的需要,还定义了一些通用的,由企业依照自己的实际来定义一些新的特性的特性实体,这些实体包括: Pty_generic_angle、 Pty_generic_binary、 Pty_generic_boolean、

Pty_generic_date、

Pty_generic_daytimeinterval、

Pty_generic_element、 Pty_generic_enumeration、 Pty_generic_integer、 Pty_generic_line、 Pty_generic_location、 Pty_generic_logical、 Pty_generic_money、 Pty_generic_point、 Pty_generic_quantity、 Pty_generic_ratio、 Pty_generic_rational、 Pty_generic_real、 Pty_generic_string、 Pty_generic_surface、 Pty_generic_time、 Pty_generic_volume。这些特性实体是3.0版本新增的,这就为企业定义自己特有的特性奠定了基础。

5 井下作业活动在POSC中的描述

按照6W模型能够将井下作业涉及的相关对象总结在表 2中。

表 2 三种模型的对比 POSC数据模型 井下作 6W模型 业模型 涉及的技术对象与业务对象 POSC数据模型中的属性 井下作业中是否有此项 活动的发起者 Instance_creator ╳ 活动的合作者 cause_association(V) ╳ 数据的提供者(商) Source ╳ Who 与合作者间建立的合同(合同Contract 治理) ╳ contract_obligation ╳ 合同双方的义务与职责 Guideline_compliance ╳ Guideline_or_privilege ╳ 实例的更新者 last_updated_by ╳ 活动的起始时刻 start_time √ 活动连续时刻 Duration ╳ 活动的终止时刻 end_time √ 实例创建时刻 instance_created_date ╳ 实例的最后更新时刻 last_updated ╳ When 活动发生的周期 ref_transient_period ╳ 活动进度表 Schedual ╳ 对进度的约束及遵循的规则 constraint_for ╳ constraint_by ╳ 进度情形记录 describing_schedual ╳ 记录活动的完成情形 fulfill ╳ fulfillment ╳ 活动发生的地点 located_by_spatial_object √ where 活动发生的周边环境 activity_context ╳ 涉及到的坐标系 coordidate_system_context ╳ Why 活动的分类 kind ╳ 对活动的描述 description ╳ Which 活动中涉及的业务对象与技术对象 involved_object √╳ 活动中产生或涉及的数据集 data_collection ╳ 该实例储备在哪一个数据集 populate ╳ What 产生的一些过程数据 process_data √╳ 定义的过程数据项的名称 process_data_item ╳ 活动中产生的或涉及的特性 pty_genral_property √╳ 更新后的数据集 update_collection ╳

POSC数据模型在2.2之前,它的可扩充性依旧专门差的,为适应不同组织对该数据

模型的需求。在定义3.0模型时充分考虑了不同组织的通用性问题,在3.0版本中,各个组织依照自己的实际需求,能够对对象以及活动特性进行扩充定义。而对活动的定义也充分考虑这了一点,以2.2之前,对活动定义了若干个子类,后来发觉这些子类的定义只能满足某些组织的需求,而不能满足另外一些组织的需求,因此在3.0版本中,取消了在2.2中对活动(Acivity)定义的子类,而取而代之的则是在Acivity中增加一个属性Kind用来标识该活动是属于哪一类活动,与此同时该属性也是一个开放的,不同的组织能够依照需要对其进行追加定义。

6 我国石油标准化存在的一些问题

第一,在我们石油工业,往常由于组织与治理分离的缘故,使得这些不同的组织在治理与制定标准时,只考虑自己企业关怀的那部分,而与其它组织相交错的地点就忽略

了。由于目前,我国的石油工业开始进行统一组织与治理,致使原先制定的一些标准不能满足目前的要求。因此在制定数据标准时要有一个全局的观点,对数据进行统一考虑,如此制定出的标准才能够满足行业内部各个企业间的需求,才能实现数据的共享。目前我们的石油勘探与开发数据标准中对技术方面的数据关怀的程度专门高,但对治理方面的关怀程度就专门低,因此在我们的石油勘探与开发数据标准中能够找到关于生产、科研、实验等方面的所谓的技术数据,而治理方面的数据则是专门少。有些数据在定义过程中存在着重复的现象,而有些数据在定义中还存在着二义性,例如一个数据项多种说明、不同的名称反映的是一个数据项等。

因此,这些标准过不能满足现代治理的需要,因此在进行我国石油行业数据建模时

必须全盘考虑,以全局的观点作为需求考虑我们的数据模型,以反映石油勘探、生产、炼化、销售及治理等的一个集成的数据模型。而POSC的数据模型在这方面是我们一个专门好的参考。

7 POSC数据模型及建模思想的指导意义

POSC数据模型技术从以下几个方面对我国石油工业建模的指导意义:POSC数据模型Epicentre的核心思想是“对象-活动-关联-特性”。这一思想与6W模型的思想是一致的。POSC通过对油田勘探与开发整个生命周期中涉及的对象进行细致地分类、并将这些对象按照层次关系组织在一起;而将油田勘探与开发整个生命周期中的各个事件按活动进行组织,认为每一个具体的事件差不多上一个活动,那个活动可能还包括若干个其它的子活动;在活动过程中,对象之间、活动之间或对象与活动之间会建立起一临时关系;不管是对象、活动依旧它们各自的临时关系或之间的关联关系的均由特性描述。这确实是POSC数据模型的核心理念。POSC依据这一理念进行数据的需求分析、并采纳朴素的面向对象的建模思想将油田勘探与开发生命周期中的对象、活动、特性及关联关系进行了统一建模。在我国的石油建模中,这一思想是专门值得借鉴的。具体来讲,我们能够从发下几个方面借鉴POSC数据模型的思想:

(1)对象的组织观点:将各种对象进行分类,并抽取各类对象的共同特性,将这些对象

从高层的角度抽象为技术对象与业务对象,认为其它对象均是这些对象的子类; (2)以活动为中心的观点:将油田中发生的各种事件抽象为活动,以活动为中心组织相

关对象,在这些对象间或活动间以及对象与活动间可能会建立起一些临时关系,那个临时关系由关联关系描述;

(3)信息重用性:不管是对象、活动、依旧关联关系,均是按照层次组织的,这就为信

息重用奠定了基础,关于重复的信息不必在子类中进行定义,而采纳继承机制直截了当从父类中直截了当继承;

(4)可扩充性:在那个地点,我们所说的可扩充性包含两个方面的含义:一个是指模型

本身结构的可扩充性、另一个是模型中对象实例的可扩充性。由于POSC数据模型采纳面向对象机制组织,因此它的扩充性是层次模型本身所固有的性质。在实际中,能够依照具体的需要来定义一个新的对象。Epicentre 3.0加强了对模型实例的扩充性,例如,为了描述对象或活动的某些专门特性,在模型中没有显示定义的情形下,能够利用实例的扩充性原理来扩充一些新特性;

(5)特性的一次定义多次引用:在POSC数据模型中,对同一特性只定义一次,具体描述

什么对象,就看该特性与什么对象捆绑在一起,与哪一对象捆绑在一起就表示什么样的含义,如此排除了由于同一特性的重复定义而造成特性的二义性问题; (6)相关对象空间信息的描述:在POSC数据模型中,业务对象中有一类对象被称为拓扑

对象,POSC可对这些对象的空间拓扑结构及位置进行完整描述;

(7)定义了丰富的标准参考值:POSC在取得各大油公司一致的情形下,定义了许多有价

值的标准参考值;

(8)数据模型中定义了能够满足于E&P应用的各种丰富的数据类型; (9)POSC为实现异构数据源间的数据存取,定义了数据交换标准。

8 总结

多年来,作者一直在关注并跟踪POSC技术的进展的研究,通过多年的研究,将这

一模型的精髓进行了全面的总结。作者依照多年IT行业工作的体会,在电信行业提出的5W模型的基础上提出了描述我国石油行业业务过程的6W模型思想。认为在油田的整个生命周期中将所发生的事件均可通过6W模型来描述,这一模型在进行需求分析过程是十分有用的,依照这一模型能够提六个方面的问题,以便全面地抽取描述某一活动中所用到的信息。与POSC数据模型相比,6W模型不是一个具体的数据模型,它不能用

来描述对象、活动、关联及特性,它只是一个概念意义上的模型。这一模型与POSC的“对象-活动-关联-特性”思想是直截了当相关的。在文中我们将POSC的数据模型及我国的井下作业模型进行了对比。通过对比能够看出,我们井下作业所涉及的数据特性均可由POSC的对象与特性模型来描述。

最后讨论了POSC数据模建模思想及模型本身对我国石油数据标准化的指导意义,

众所周知,不管是POSC的数据模型,依旧它的一些其它的相关标准均是为石油勘探与开发中的信息集成与交换制定的,具有普遍的参考价值。

建立一个能满足现代石油工业需求的统一、标准化的数据模型,是现代石油工业进

展的必经之路。这一模型的建立不仅有利于中国石油工业内部企业间信息的联动,也有利于与世界石油行业的互动。在世界石油竞争中发挥中石油的优势,才能实现直正意义上的以信息化带动现代化的美好蓝图!

文中不当之处,还请专家指正。

因篇幅问题不能全部显示,请点此查看更多更全内容