联机分析处理系统

2024-06-29

联机分析处理系统(精选八篇)

联机分析处理系统 篇1

机械故障诊断技术是了解和掌握设备的运行状态, 识别设备的异常表现, 早期发现设备潜在故障并预报故障发展趋势的技术。通过对设备进行状态监测和故障诊断, 可以确定合理的检修时间和方案, 达到减少事故停机损失、提高设备运行可靠性、降低维修费用的目的, 成为解决复杂系统安全性、可靠性、维修决策的科学性问题的关键技术之一。

机械状态监测与故障诊断的信号有振动、噪声、温度、压力、流量等, 其进行具体的有针对性的分析和处理, 提取出对诊断有用的敏感征兆。可以为机械设备维修部门的宏观管理、决策和指导提供科学依据, 以提高机械设备维修的质量和设备保障能力。但是, 目前对机械设备维修信息的利用手段比较落后, 传统的数据事务处理方法难以使大量数据得到充分利用[1,2,3]。而联机分析处理 (Online Analytical Process, OLAP) 技术的出现使得方便、快捷地访问和分析监测数据成为可能。

该系统借鉴国内一些监测的开发经验, 同时结合机床的实际特点, 综合运用数据仓库、OLAP及数据挖掘技术建立了监测数据分析系统。经实践证明, 该系统不仅能够对状态监测数据进行很好的分析、展现, 掌握其中规律, 为设备故障诊断与维修决策提供有效支持, 还对进一步全面实现机电设备在线监测起到有效的促进作用。

1OLAP与数据挖掘技术[4,5]

1.1 基本概念

数据仓库中尽管包含了大量的有价值的历史数据, 但如果让决策支持人员直接去看这些数据是没有任何实际意义的, 必须要有方便有效的工具能够很容易地对其中的数据进行分析处理。1993年, E.F.Codd提出联机分析处理 (OLAP) 的概念。简单地说它就是针对特定问题的联机数据访问和分析。应该说, 它是利用存储在数据仓库中的数据, 根据用户提出的问题或假设, 进行各种分析操作, 并以较为直观易懂的形式将结果返回给用户, 具有提供数据的多维逻辑视图、快速响应用户分析请求, 为用户提供强大的统计、分析功能等一些特点。

数据挖掘主要是基于人工智能, 机器学习, 统计学等技术, 对数据仓库中的数据进行一定的处理, 从而获得其中隐含的、事先未知的而又可能极为有用的信息, 做出归纳性的推理, 挖掘出潜在的模式并预测客户的行为, 帮助企业决策者调整市场策略, 减少风险, 做出正确决策。它最为显著的特点是分析过程的自动化和知识发现。

OLAP和数据挖掘是相辅相成的, 但它们的侧重点不同。OLAP侧重于与用户的交互、快速的响应速度及提供数据的多维视图, 而数据挖掘则注重自动发现隐藏在数据中的模式和有用信息。OLAP的分析结果可以给数据挖掘提供分析信息作为挖掘的依据, 数据挖掘可以拓展OLAP分析的深度, 可以发现OLAP所不能发现的更为复杂、细致的信息。

1.2 分析方法

通过切片、切块、上钻、下钻、旋转等操作, 可以在不同的粒度上对数据进行分析尝试, 得到不同形式的知识和结果。

(1) 钻取 (Drilling)

钻取是改变维的层次, 变换分析的粒度。向上钻取是在某一维上将低层次的细节数据概括到高层次的汇总数据或者减少维数;向下钻取则是由不太详细的数据到更详细的数据。

(2) 切片 (Slicing)

切片指是在多维的数据库的某一维上选定一个维成员的动作。在时间维上选定一个维成员就得到了在时间维上的一个切片。

(3) 切块 (Dicing)

切块是指在多维数据库的某一维上选定某一区间的维成员的动作。

(4) 旋转 (Pivoting)

旋转就是改变一个报告或页面显示的维方向, 即在表格中重新安排维的位置。旋转包含了交换行和列或把某一个行维移到列维中去, 或是把页面显示中的一个维和页面外的维进行交换。

通过以上这些“动作”及“动作”的组合, 用户可以方便、准确的获得所需的数据进行进一步的分析。在使用的数据信息量比较庞大时, 每一组多维数据都可以采用三维的结构, 即采用多次切片的分析动作。

2系统数据仓库的建立

2.1 数据准备

设备维修信息研究的主要目的是挖掘隐藏在大量历史数据背后的规律性, 并以此为设备维修保障部门做出合理的决策提供科学依据。考虑到客户想在原有的OLTP (联机事务处理) 基础上构造OLAP应用, 主要用来分析维修情况, 所以在选用产品上应该本着实用原则。

数据准备包括数据抽取、清洗、转换和加载 (ECTL) , 具体包含数据的清洗 (或称清理) 、集成、选择、变换、规约以及数据质量分析等步骤。基于此目的, 在对设备维修的历史数据存储结构进行分析后, 选择对研究起决定作用的数据, 将分散在OLTP数据库中的数据经过DTS以及专用程序将原始数据进行清理和转换得到了“干净”、“完整”的、适合进行分析的数据, 加载到Microsoft SQL Server创建的OLAP数据库中, 保证类型和结构的统一。比如, 对日期和时间格式的统一。并且需要将某些数据变换为适合挖掘的形式, 比如将机床运行时间由具体的时间划分为不同的时间段。

2.2 数据模型

在问题进一步明确, 数据结构和内容进一步调整的基础上, 就可以形成知识的模型。对于数据挖掘模块的设计, 由于数据庞大, 本系统采用客户/服务器结构, 客户端用Visual Basic开发, 数据库服务器采用Microsoft SQL Server 2000, 利用SQL Server的OLAP Service应用服务器, 将定义的主题 (立方体) 生成聚集, 并实体化, 其后进行的OLAP和数据挖掘都是基于此处生成的主题。挖掘的数据源是数据仓库中详细和综合数据层中的表。

多维数据库按照决策的需要而构建数据库模型, 形成信息的多维视图结构。多维数据结构是将原始数据按维进行整理后所得的结果。利用Microsoft OLAP Server创建的多维数据结构称为 Cube, 该多维数据结构具有良好的性能, 能灵活、快速地处理原始数据, 并对各种查询具有一致性的响应速度。这里采用流行的星型模型。星型模式是面向关系型数据库和面向OLAP的一种多维化的数据组织方式。关系型数据库将多维结构分为两类表:一类为事实表, 用来储存事实的度量值和各维的码值;另一类为维表, 对每一维来说, 至少有一个表用来保存该维的元数据, 即维的描述信息。例如:对类型征兆情况, 可以有机床类型名称维、机床代码维、机床名称维、现象代码维、故障现象维等;对故障情况, 可以有时间维、单位维、型号维、故障类别维等。此外, 不同的维又可以进行细化, 形成树型结构, 例如, 时间维可细化为:年-月-日。

根据主题和多维结构, 本文在SQL Server 2000平台上采用星型模式构建数据仓库。以“维修情况”为例建立的星型结构如图 1 所示。

3系统的建立[6,7]

该系统以张家口某机械设备制造公司为背景, 主要针对该公司机械设备在线监测数据的分析工作。主要实施对公司内部分电动机、机床的轴承设备、主轴设备和油泵设备进行监测。由于监测系统的应用, 可以根据设备的实际故障情况安排维修, 避免了维修过度或不及时, 能够合理制定维修计划和合理配置人力、物力, 公司的设备维修费也降低了20%, 维修强度、密度也大大下降。

3.1 系统设计

根据用户的要求, 基于Intranet 网络和原有的数据环境, 设计了基于客户/服务器体系的系统结构, 在服务器端口采用 OLAP 技术建立数据模型[8], 客户端利用Microsoft Excel 2000实现多维数据的访问。

数据仓库为OLAP和数据挖掘提供了良好的基础数据, 在此基础上, 可以对其中的主题进行分析和挖掘。由于OLAP处于较浅的分析层次, 数据挖掘所处的位置较深, 因而通常将二者结合使用以达到最佳的分析效果, 利用数据挖掘来挖掘潜在的模式预测未来趋势, 利用OLAP验证数据挖掘的结果。

3.2 系统结构

数据准备、数据仓库建立和设备维修数据分析三者相互作用, 构成一个层次分明结构合理的数据分析系统, 整个系统分为三个部分:

(1) 企业服务器。不同数据源的原始数据经过筛选存储到细节性数据OLAP数据库。

(2) OLAP服务器。存储数据仓库中的综合数据, 如不同变电站不同设备的数据等。

(3) 客户端软件。实现最终用户功能, 能方便、快捷地分析、处理数据, 支持OLAP操作。

考虑到客户想在原有的OLTP基础上构造OLAP应用, 主要用来分析维修情况, 所以在选用产品上应该本着使用原则[9]。OLAP服务器选用Microsoft OLAP Server, Microsoft OLAP Service 是Microsoft SQL Server 7.0 附带的一个组件, Microsoft OLAP Server 只能提供高层MOLAP产品的60%~80%的功能, 但注册和维护费用要低的多。Microsoft OLAP Server可以处理大公司的部门级需求, 也可以处理小型和中型企业的整个组织需求。系统部分结构如图2所示。

4系统数据分析[7,10,11]

机床维修数据库中存放着大量的细节数据, 而决策者通常希望以简洁的描述形式观察汇总的数据集, 此外还希望从不同的粒度和角度描述数据集, 这就需要采用描述式数据分析。

描述式数据分析是以简洁概要的方式描述变压器维修信息, 并提供数据的一般性质。本系统主要采用SQL Server 2000平台的OLAP和Pivot Tables Services直接与服务器端OLAP进行通信, 该服务提供一个客户端可以访问的接口, 利用许多前端的工具通过OLE DB来使用数据透视表服务, 如Excel 2000可通过Microsoft OLE DB Provider for OLAP Server与OLAP建立连接, 采用OLAP方式对设备维修数据在不同维度中进行下钻、上卷、旋转、切块和切片等分析操作, 可以综合各种灵活、界面友好的显示技术, 最终将结果以多维的形式显示给用户。如:对于故障情况, 在时间维和单位维之上进行分析, 可以确定各单位在不同时间段内故障数量的总和、维修次数等, 决策者可根据分析结果清楚地掌握各单位在不同时间的机床故障总体情况;同样, 也可在其他维度之上对故障情况进行分析。

大量机械设备维修数据之后有很多隐含的、未知的并且具有巨大潜在应用价值的信息。这些信息具有规律性, 可以用来预测新的行为, 对未来的决策具有指导意义。寻找此类信息需要对机械设备维修数据进行预测式数据分析。本系统平台之上建立关联、预测等模型对设备维修数据进行预测分析。

通过关联分析可以发现各项集之间的有趣关联或相关关系, 主要采用Apriori算法及其改进算法, 以机床故障情况为例进行关联分析可以发现影响机床故障的主要因素:机床产生振动、型号、主轴套管磨损、故障件等并确定各因素所占的比重。决策者可以根据分析结果清楚地了解到:如在电动机转子不平衡、机床各结合面松动、带轮振摆过大、齿轮销槽磨损等条件下机床故障次数及故障率偏高的因素等信息, 便可做出在工作强度大等条件下加强机床维修的力度的对策。

5结语

本文对机械设备维修信息提出了一种基于OLAP研究方法, 并建立起完整的体系结构, 可以进行动态查询、分析, 并且方便、快捷地将查询结果展现给管理人员。对机械设备维修信息进行研究, 可以大大提高维修现代化管理水平, 提高机械设备维修质量水平, 加快设备维修信息化进程。该方案完全能够满足企业的OLAP要求, 可以进行二次开发, 可以满足客户的特殊要求, 并具有灵活、投资小的优点, 非常适合小企业, 具有一定的推广价值。在其他机械设备的维修方案中可以尝试, 以真正提高在线监测的应用水平, 为状态维修奠定基础。

摘要:信号处理是机械设备故障诊断中的关键技术, 起着对监测信号进行加工、变换, 从中提取敏感故障征兆的重要作用。针对当前机械设备维修信息处理和分析过程中存在的问题, 分析了联机分析处理和数据挖掘技术的相关理论, 提出基于联机分析处理和数据挖掘技术实现在线监测数据的星型数据系统模型。系统采用客户/服务器结构, 实践证明该系统可根据实际需要高效地对机械设备维修信息进行在线分析、预测, 为进一步全面实现机电设备在线监测起到有效支持。

关键词:机械设备,OLAP,数据处理,数据挖掘

参考文献

[1]王珊.数据仓库技术与联机分析处理[M].北京:科学出版社, 1998.

[2]张维明, 邓苏, 刘青宝, 等.数据仓库原理与应用[M].北京:电子工业出版社, 2002.

[3]史忠植.知识发现[M].北京:清华大学出版社, 2002.

[4]陈京民.数据仓库与数据挖掘技术[M].北京:电子工业出版社, 2002.

[5]Han Jiawei, Kamber M.Data Mining:Concepts and Techniques[M].America:Morgan Kaufman Publishers, Inc.2001.

[6]胡迎松.设备维护管理系统的研究与开发[J].电子技术应用, 1999 (9) :12-14.

[7]徐伟杰, 蔡智勇, 万军.基于数据库的故障诊断系统知识管理方法[J].机械与电子, 2002 (3) :76-77.

[8]喻钢, 周定康.联机分析处理 (OLAP) 技术的研究[J].计算机应用, 2001, 21 (11) :80-82.

[9]罗运模.SQL Server 2000数据仓库应用与开发[M].北京:人民邮电出版社, 2001.

[10]周德照, 张进明, 江志农.基于JSP的压缩机远程状态监测与故障诊断系统[J].机电工程技术, 2005, 34 (6) :50-52.

[11]何岭松, 王峻峰.基于因特网的设备故障远程协作诊断技术[J].中国机械工程, 1999, 10 (3) :336-338.

联机分析处理系统 篇2

摘要:数据仓库是信息业界的明日之星,数据仓库与联机事务处理(OLAP)是过去十几年来最热门的信息领域,它们的目标是以计算机来取代许多当前的作业。文章首先介绍了数据仓库和联机分析处理技术的基本概念,比较并分析了它们同传统的数据库的差异,最后介绍并探讨了联机分析处理技术的发展领域。

关键词:关键词:数据仓库;联机分析处理;联机事务处理;传统数据库

中图分类号:TP392 文献标志码:A 文章编号:

引言:

随着市场竞争的日趋激烈,信息对于企业的生存和发展发挥着越来越重要的作用。与此同时,在各个领域产生了大量的数据,但是面对不断增加如潮水般的数据,传统的数据库管理系统已无法满足决策支持系统对数据的要求,因此人们提出了更深层次的问题:能不能从数据中 提取信息或者知识为决策服务。在这种情况下,一种适用于决策支持系统的数据组织与管理技术—数据仓库1技术应运而生。

1.数据仓库技术

1.1 数据库到数据仓库的演变

传统的数据库与OLTP(On-Line Transaction Process)平台并不是为了分析数据而设计的,用户可以在一个OLTP平台上安装数个应用系统,它在数据共享、数据与应用程序的独立性、维护数据的一致性和完整行及数据的安全保密性等方面提供了有效的手段。但是当它与分析型应用结合时,却出现了许多问题。

首先,利用传统的数据库进行数据分析,分析的结果缺乏可靠性。其次,利用传统的数据库进行数据处理,其效率很低。第三,传统的数据库难以将数据转化成信息。第四,传统的数据库系统主要用于事务处理,而在事务处理型的应用环境中直接构建分析决策型应用是不可能的。所以,为了提高分析和决策的效率和有效性,面向分析决策型应用的数据处理及其数据必须与事务处理型应用环境分离,建立单独的分析决策型应用环境。数据仓库正是为了解决这一问题而诞生的一种数据存储和组织技术。

数据仓库与传统的数据库的不同之处在于数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它可以支持企业或组织的决策分析处理2。

2. 联机分析处理技术

联机分析处理OLAP(On-Line Analytical Processing)技术3是基于数据仓库进行数据分析的一种技术。OLAP可使企业数据分析人员、企业经理及企业其他管理人员通过对企业信息的多种可能的观察角度进行快速、一致和交互性的存取,以获得对信息的深入理解。

2.1 OLAP的基本特性

OLAP是数据处理的一种技术概念,其定义简单的概括为:共享多维信息的快速分析。OLAP通过对多维信息以很多种可能的观察方式进行快速、稳定一致和交互性的存取,允许管理决策人对数据进行深入观察。其特点4有四个方面:

(1)快速性。用户对OLAP的快速反应能力有很高的要求。要求系统能在几秒钟内对用户的多数分析要求做出反应;

(2)可分析性。OLAP系统应能处理与应用有关的任何逻辑分析和统计分析;

(3)多维性。多维性是OLAP的关键属性和灵魂,系统能够提供对数据分析的多维视图和分析,包括层次维和多重层次维的支持。

(4)信息性。OLAP系统能够及时获得信息,并且管理大容量信息;

(5)共享性。共享性是在大量用户间实现潜在地共享秘密数据所必须的安全需求。

2.2 OLAP的基本分析操作

OLAP的基本操作是指通过对多维形式组织起来的数据进行切片、切块、聚合、钻取、旋转等分析动作,以求剖析数据使用户能够从多种维度、多个侧面、多种数据综合度查看数据,从而深入地了解包含在数据中的信息、内涵。

(1)切片(Slicing)。

切片操作就是在某个或某些维上选定一个属性成员,而在其他维上取一定区间的属性成员,或全部属性成员来观察数据的一种分析方式。

(2)切块(Dicing)。

切块就是在各个维上取一定区间的成员属性,或全部成员属性来观察数据的一种分析方式。从另一个角度讲,切块可以看成是在切片的基础上,进一步确定各个属性成员的区间得到的片段体,也即由多个切片叠合起来。

(3)钻取(Drilling)。

钻取包含向下钻(Drill-down)和向上钻(Drill-up) /上卷(Roll-up)操作。下钻指从概括性的数据出发获得相应的更详细的数据,上钻则相反。钻取的深度与维度所划分的层次相对应。

(4)旋转(Pivoting)。

旋转即改变一个报告或页面显示的维方向。旋转可能包含交换行和列,或是把某一个行维移到列为中去,或包页面显示中的一个维和页面外的维进行交换。

3. OLAP与数据仓库

在数据仓库中 ,OLAP和数据仓库是密不可分的,但是两者是不同的概念。

数据仓库是一个包含企业历史数据的大规模数据库,这些历史数据要用于对企业的经营决策提供分析和支持。数据仓库中的数据是不能用于OLTP的,而OLAP则利用数据仓库中的数据进行联机分析,将复杂的分析查询结果快速地返回用户。OLAP利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总,用联机分析和可视化工具对这些数据迅速进行评价。

OLAP可用多级结构表示数据仓库中的数据,创建组织和汇总数据的立方体,这样才能有效的提高用户复杂查询的要求。因此数据仓库的结构将直接影响立方体的设计和构造,也就影响了OLAP的工作效率。

从OLAP使用的效率角度考虑,在设计数据仓库时应该考虑一下几个因素:

(1)尽可能使用星型架构,如果采用雪花结构,就要最小化事实表底层维度表以后的维度表数量。

(2)为用户设计包含事实表的维度表,这些维度表应该包含有意义的、用户希望了解的信息。

(3)度表的设计应该符合通常意义上的范式约束,维度表中不要出现无关的数据。

(4)事实表中不要包含汇总数据,事实表中包含的用户需要访问的数据应该具有必需的粒度,这些数据应该是同一层次的数据。

(5)对事实表和维度表中的关键字必须创建索引,同一中数据尽可能使用一个事实表。

(6)保证数据的参考完整性,使事实表中的所有数据都出现在所有的维度表中,避免事实表中的某些数据行在立方体进行聚集运算时没有参加过来。

4. OLAP的发展

OLAP技术5是在市场竞争日益激烈,决策人员迫切需要准确及时并且可以灵活访问的决策信息的背景下兴起的.。其主要的发展领域为:

(1)市场和销售分析

几乎每个商业公司都需要此类软件,但其大规模分布在:生活消费品行业、零售业、金融服务业。此类行业通常都需要用发哦OLAP能够对大量数据进行复杂的分析和统计功能。

(2)电子商务分析

电子商务网站记录了用户在网上的所有行为,为更精细的分析用户行为提供了可能。一个典型的商业网站每天都产生大量的数据,简单手工分析显然难以胜任,用多维、分层OLAP可以很好的把这些数据组织起来。

(3)基于历史数据的营销

通过各种不同的历史数据,用数据挖掘或统计的方法,找到针对某项服务或商品的销售对象。虽然传统上不是OLAP的范围,但是通过多维数据分析的引入,会取得更好的效果。

(4)预算

预算通常是从下到上提交和从上到下约束的反复过程,OLAP工具可以在这个过程中提供分析能力。预算制定者利用OLAP提供的工具浏览市场、销售、生成及合并计划等企业全方位的数据,得到一个较合理的方案,也可以利用这些数据自动制定出方案。

(5)财务报告与整合

早起的财务报告整合系统与现在OLAP相似,但是OLAP利用对多维数据的分析能够更好的对其进行管理。

(6)管理报告

(7)利益率分析

(8)质量分析

5. 小结

数据仓库和联机分析处理技术在市场竞争日益激烈的的背景下逐渐兴起,目前正处于快速发展的阶段。文章首先对数据仓库和联机分析处理技术做了详细介绍并将它们和传统的数据库做了对比,得出数据仓库和联机分析处理技术是在传统数据库无法到达设计者需求下产生的。文章最后对联机分析处理技术的发展领域做了介绍和分析。相信在不久的将来基于数据仓库的联机分析处理技术定会成为处理数据的主流技术。

参考文献:

HanJiawei,LuHongjun:The Leeture of Datamining and DatawarehouseSP Onsoredby:IBM China University RelationshiPs,1995年

联机分析处理系统 篇3

HIS(Hospital information system,医院信息系统)在绝大多数医院得到了广泛的使用,经过多年的运行,在医院信息系统中积累了大量珍贵的历史数据,如何深入挖掘隐藏在这些数据背后的信息,为医院管理决策和医疗诊断服务,为其提供客观可信的分析数据,是医院目前面临的一个问题。但是医院信息系统和大多数的信息管理系统一样,主要功能是业务处理和数据储存,而对数据的进一步组织、整理、分析均不能完全胜任。数据仓库技术和OLAP技术的出现,为进一步充分利用医院数据提供了有效的理论和方法指导。

1 OLAP简介

1.1 OLAP的概念

OLAP(Online Analytical Processing,联机分析处理),其定义是:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来并能够真正为用户所理解,能真实反映企业维持性的信息进行快速、一致地交互存取,从而获得对数据更深入了解的一类软件技术[1]。

OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。联机分析处理(OLAP)是针对特定问题的联机数据访问和分析。它可使数据分析人员及管理人员通过对信息进行快速、稳定、一致和交互式的存取,对数据进行多层次、多阶段的分析处理,以获得高度归纳的分析结果。决策分析需要从不同的角度观察分析数据,以多维数据为核心的多维数据分析是决策的主要内容,维是人们观察现实世界的角度,多维数据库以多维方式来组织数据[2]。

1.2 OLAP的特点

OLAP技术有两个主要的特点:一是在线性,表现为对用户请求的快速响应和交互式操作,它的实现是由客户机/服务器体系结构完成的;二是多维分析,这也是OLAP技术的核心所在[3]。

1.3 OLAP的体系结构

OLAP是界于客户与数据仓库之间的数据分析处理系统,它需要对来自数据仓库的数据进行多维处理和分析,因此在系统构造中常采用如图1所示的三层客户机/服务器结构[4]。第一层数据仓库服务器,它实现与业务处理系统的连接,完成数据的共享;第二层OLAP服务器按照客户的请求完成数据各种分析动作以及后台数据存储、报表处理等;第三层是客户端,它负责将OLAP处理得到的结果直观地展现给最终用户。这种三层客户/服务器的结构将数据仓库、OLAP服务器与客户端严格区分。

2 OLAP在HIS中的应用

OLAP是利用了数据仓库的大量信息资源,对数据进行多维地深入分析,从而使决策人员能够从不同角度对企业数据进行观察并得到有益信息。按照主题建立好了数据仓库以后,需要使用OLAP工具将这些数据进行多维化处理,构建多维数据模型,并对多维数据模型中的数据进行处理,使用如切片、切块、旋转、钻取等多维分析方法对数据进行多角度、多层次地查询分析,并以比较直观的方式展现出来。下面以医院信息系统中的历史数据,以就诊人数为主题进行多维度地分析。

2.1 OLAP的分析操作

OLAP的基本操作是指对以多维形式组织起来的数据采取切片、切块、旋转等各种分析动作,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据仓库中的数据,从而深入地了解包含在数据中的信息和内涵。

(1)切片:切片操作就是在某个或某些维上选定一个属性成员,而在其他维上取一定区间的属性成员或全部成员来观察数据的一种分析方式。

例如:在时间维上选定成员2008年,科室维和挂号类别维取全部属性成员的切片,操作如图2所示。

(2)切块:切块就是在各个维上取一定区间的成员属性或全部属性来观察数据的一种分析方式。可以认为切片是切块的特例,切块是切片的扩展。

例如:在时间维上选定成员2007到2008年度,科室维和挂号类别维取全部属性成员的切块,操作如图3所示。

(3)钻取:钻取包含向下钻和向上钻操作,下钻指从概括性的数据出发获得相应的更详细的数据,上钻则相反。钻取的深度与维所划分的层次相对应。

图4按时间维进行钻取操作的示意图。

(4)旋转:旋转即改变一个报告或页面显示的维方向,可能包括交换行和列,或是把某一个行维移到列维中去,或是把页面显示中的一个维和页面外的维进行交换。

图5是一个旋转的示意图,旋转之前,便于对同一年度不同季度的门诊量情况进行对比分析;旋转之后,则便于对不同年份同一季度的门诊量情况进行对比分析。

2.2 OLAP在医院的应用

使用联机分析技术处理HIS系统数据仓库可以对以下各类不同的主题和需求对各类数据进行分析。

(1)病人信息分析:分析医院门诊住院病人的各类情况,如身份分布、年龄分布、地域分布等,以便能够有针对性地采取措施来提高服务质量,加强疾病预防,指导患者及时就诊。

(2)医疗费用分析:分析不同疾病的各项费用情况,分析各类病人医药费情况,对各类治疗费、检查费、药费比例等进行控制,分析原因制定策略,抑制收费不合理的情况出现。

(3)数据比较分析:对医院的各种数据,比如费用、门诊量、住院人数等常用指标,进行比较,分析各类数据变化的原因,并制定今后目标。

(4)医疗数据分析:分析各类疾病的发病率、治愈率等医疗数据,为医疗质量控制、疾病防控提供参考数据。

3 小结

根据需求对各类数据进行抽取、整理、集成等,再按照各种主题进行重新组织,建立基于医院信息系统的数据仓库,使其能够适合医院自身需求。使用联机分析处理技术从大量的信息中获取更多深层次的信息,可以使管理人员全面了解医院的业务状况,通过系统对数据的综合分析、挖掘,为医院的管理人员提供决策的依据;优化资源配置、降低材料消耗、减低运行成本、提高服务质量、预测各种关键指标的变化趋势,及时应对各类可能出现的问题,优化医院的业务处理流程,提升医院综合管理水平。

摘要:医院信息系统经过长期的运行,积累了大量的病人就诊的历史数据。联机分析处理是用于对数据仓库进行查询的一种技术,适用于对大量数据进行快速的分析。使用联机分析处理技术,设计不同的主题,对基于医院信息系统数据仓库进行处理分析,可以获得更多真实可信的信息,提升医院的管理水平。

关键词:HIS,数据仓库,联机分析处理技术

参考文献

[1]王珊,等.数据仓库技术与联机分析处理[M].北京:科学出版社,2000.

[2]林杰斌,刘明德,陈湘.数据挖掘与OLAP理论与务实[M].北京:清华大学出版社,2002.

[3]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].范明,孟小峰,等,译.北京:机械工业出版社,2008.

[4]陈京民.数据仓库原理、设计与应用[M].北京:中国水利水电出版社,2004.

[5]林杰斌,刘明德,陈湘.数据挖掘与OLAP理论与务实[M].北京:清华大学出版社,2002.

[6]谭明金.数据仓库工具箱维度建模的完全指南[M].北京:电子工业出版社,2003.

[7]沈兆阳.SQL Server 2000O LAP解决方案数据仓库与Analysis Services[M].北京:清华大学出版社,2001.

[8]杨莉萍,杨晓红.Office Web组件在OLAP分析系统中的应用[J].计算机系统应用,2004(11):70-72.

[9]韩明华.基于Web的OLAP医药销售分析系统的设计与实现[J].软件导刊,2005(14):18-21.

[10]程宝石,黄志军,曾斌.OLAP结构分析及实现技术[J].计算机与数字工程,2001,29(2):38-40.

联机交易处理系统的系统设计(下) 篇4

四、联机程序的设计

许多程序设计员接到程序开发任务时, 马上就坐到计算机面前打开编辑器进行编码, 这是十分不好的做法。其实, 程序的开发分为程序设计、编码、测试等环节。按软件生产的概念, 程序设计是脑力劳动, 程序编码是体力劳动。程序员应根据程序功能说明书的要求, 列出更新条件表, 设计出流程图, 再动手编码。

(一) 程序要做的事情

一般的联机程序, 要做的工作及其顺序如图1所示。

程序工作区的初值设置要用显式、逐一置值的方式, 置值的对象应为基本项, 而非集团项。

读入交易信息的检查是一种彻底的、标准的检查, 其中包括物理检查、逻辑检查、相关性检查。最终目的, 是尽早发现错误的输入数据, 且绝不允许联机程序因输入数据的合法性有问题而导致非正常终了。

在系统设计时, 要把整个系统的所有内存表资源、数据库资源按某一顺序排序;再把每个数据库资源 (如某一个表) 内的各种键 (主键、次键) 按某一顺序排序;还要把每个数据库资源 (如某一个表) 的内部记录按某一顺序 (如按键的升序) 排序。程序在有实质动作 (如更新、写) 之前, 要把相应交易所要存取的上述资源进行事先读取。并且, 任一程序均应严格按照上述系统设计的顺序, 依次读出其所需的全部表、数据库的相应记录。

特别要指出, 如果某些程序在某些交易中, 需要存取某个表、某个数据库中不止一条记录, 则要按事先约定好的键顺序、记录顺序依次读取这些记录。只有严格按照上述规定, 才能避免程序之间的死锁。同理, 对于被调用的子程序、公共模块, 也要有一个统一的调用顺序。

在应用程序逻辑允许的情况下, 占用资源次序的原则是:

先读不排他资源, 再读排他资源, 以减少排他占用时间;

先读排他范围小的资源 (如本柜员、本终端表) , 再读排他范围较大的资源 (如网点表) , 最后读全局资源 (如系统表) , 以缩小排他影响范围;

读一个资源检查一个, 及时发现问题从而及早终止程序, 避免无效读, 以消除资源的无效占用;

影响范围特别大而又必须早参照的数据, 可以考虑第一次先不排他读出参照, 当发现需要更新时, 再在最后把它排他读出, 以减少排他占用的机会和时间;

一个交易所需存取的控制表、数据库越少越好, 最多不应超过几十个。而对同一数据库, 若是动态的更新读, 所读记录也是越少越好, 最多不应超过几十个;若是不排他顺序参照读, 所读记录数不应超过100个。否则, 会影响程序的效率, 进而影响整个系统的效率。如果超出上述指标, 应检讨程序的设计方案。

若某种联机业务确需一次存取大量记录 (如批量记账或查找) , 可通过技术分批或用多个交易完成, 从而把一个程序所要存取资源的数量限制在上述范围内。

除内存表外, 不允许对数据库进行大量的非键值存取, 除非确认该非键值存取的实际I/O数限制在数十个之内。

对控制表、数据库的数据检查, 主要是各种合法性、限制的检查。

程序要调用流程外的子程序, 不管是内部调用、外部调用还是系统调用, 下一语句一定是检查调用返回码, 以确认调用的结果。如果正确就往下走, 出错了就转到错误处理流程。

以严密的判断确保回滚 (ROLLBACK) 的最小化。一个设计完善的程序, 仅在程序已经对数据库进行实际更新后发现出错, 才把回滚处理作为不得不采取的对策。请记住:ROLLBACK其实是让系统对程序以前已做的动作做出回滚, 其动作会带来额外的系统开销。

(二) 程序的结束

程序的结束有3种状态:

正常结束, 释放资源;

在发出第一个改变数据库数据的命令之前, 发现错误, 则对外发送出错代码, 释放资源;

在发出第一个改变数据库数据的命令之后发现出错时, 除了要进行交易恢复 (ROLLBACK) , 以保证数据的一致性外, 还要特别注意:一是尽量把出错信息记录下来, 二是转到故障处理程序, 以完成一个交易本应完成的一些逻辑动作 (如输出处理有误信息、释放资源等) , 否则, 会造成通信或进程死锁。

出现上述问题或者更严重的错误, 作出相应处理后希望还能够取得有关DUMP信息, 可以发出ABEND命令, 把非正常结束控制交给系统。

程序的错误代码要详尽, 起码应有如下内容:

出错程序名、交易名;

如果是I/O错, 应有出错资源 (如文件、表) 名、动作 (如读、写) 代码、键值;

如果是接收、发送错。应有出错对象名 (如终端逻辑、物理名) ;

错误描述 (错误代码) 。错误描述 (代码) 应面向用户 (操作员) , 不要用技术性太强的专业术语。

要恰当地定义程序的超时时间, 一般可以定在数秒之内。当程序的运行时间超过所指定的超时时间, 系统会让程序非正常终止, 以及时释放程序占用的资源。太长的超时时间会占用大量的机器资源, 从而大大降低机器的效率。如果程序设计不好, 还容易引起大量死锁, 直到机器死机。

(三) 程序的架构

一个好的程序要做到高内聚、松耦合, 特别是要落实程序之间的松耦合。通常, 联机程序在进行交易请求信息的输入、相关数据库的访问、交易结果信息的输出时一定与外界有信息交换。这3个方面的外连, 均可通过外部接口对外、内部接口对内、中间加数据转换逻辑进行隔离。

程序架构如图2所示。

从图2可见, 我们编制一个程序 (这里叫子程序) , 不仅定义了与主程序通信的外部输入接口、输出接口以及外部I/O接口, 还在程序内部定义了对应的内部接口。分别通过第3、第5、第7步程序逻辑, 进行外部接口与内部接口的转换。程序的其他处理逻辑使用的都是内部定义的接口数据。这样, 如果外部环境 (主程序、数据库) 变化引起外部接口变化, 而该变化与本程序又没有关系的话, 本程序的主要处理逻辑均不用修改。

上述程序架构, 在一些输入输出信息为非固定格式、非定长 (如ISO8583) 的程序中, 已经普遍使用。

(四) 程序的可读性

为了程序的可读性, 以有利于程序维护, 联机程序不适宜多层大量调用外部纯逻辑功能模块, 特别是有实质性逻辑动作的功能模块。对于一些较标准的逻辑, 可作为拷贝附本 (Copy Book) , 直接拷贝到原程序并指定展开。

程序用的变量名不要用XYZ或ABC之类短名, 要充分利用程序语言的规定, 使用较长的有意义的名字, 以提高程序的可读性。与写文章一样, 程序语句应该尽量简短, 最好一个程序语句只包含一个动词或者一个判断。如果用非文本语言 (汇编、C等) , 每一个程序行均应该有详细的注解。

五、程序接口

计算机程序间的接口, 是指计算机不同程序之间传递的信息及这些信息的交换规范。这些信息交换, 包括在同一台服务器内不同的程序相互之间的信息交换;也包括在同一个系统里不同的服务器上不同的应用通过连接服务器的网络进行的信息交换, 还包括与系统外的系统进行的信息交换。

(一) 系统之间的接口

当与系统外的系统进行信息交换时, 2个系统之间必须商定信息交换的规范。这些规范通常包括通信协议、通信报文等。2个程序只要遵循该规范, 通过规定的信息交互报文进行信息沟通, 就能实现约定的功能。

这里涉及2个概念:一个是通信规范, 通常也叫通信协议;另外一个是报文协议。

通信协议在程序信息交换中是一个比较底层的概念, 例如网络通信协议OSI参考模型、TCP/IP模型等通常在应用层面, 不需要特别关注。

报文协议则是程序需要直接打交道的。当然, 进行信息交换的双方可以约定使用某一方规定的报文协议, 也可以约定一个新的报文协议。但最好是使用业界比较流行的报文协议。例如, 当前国际上与金融行业相关的比较流行的信息交换协议有:EDI (Electronic Data Interchange, 电子数据交换) , ISO8583 (Financial Transaction Card Originated Message Interchange Message Specification, 金融交易卡信息交换格式标准) , SWIFT (Society for Worldwide Interbank Financial Telecommunication, 环球银行金融通信协会) , IFX (Interactive Financial Exchange, 金融数据交换) 等。

通常, 系统之间的信息交换协议选择余地不大, 往往取决于连接的双方系统的条件和现状。

(二) 系统内的接口

在同一个金融系统内, 除了金融卡交易由终端到中后台服务器之间的信息交换还会使用ISO8583协议外, 系统内的信息交换鲜有使用上述通用的信息交换协议。通常都是由程序设计员定制固定格式、固定长度的信息交换接口。这样做的好处是:由于信息交换的使用范围相对小且固定, 需要考虑的因素不多, 接口可以快速定制, 精简明了;程序使用简单, 效率高;这种状况估计在许多金融应用系统里都存在, 但也存在不少问题。

随着应用系统的发展, 系统规模越来越大, 越来越复杂。并且, 整个社会发展也越来越快, 市场对应用系统要求也越来越高, 系统要适应新形势, 与时俱进, 就必须不断修改和完善。这样, 程序接口就成为系统维护的主要瓶颈。

由于接口都是根据具体程序定制, 其粒度比较细。接口的数量快速膨胀, 一些大银行的应用系统, 接口数按万计算, 极大地增加了管理成本。

由于接口是固定格式, 接口与程序呈紧耦合关系。只要应用功能有什么修改, 涉及的接口也要修改, 然后是接口涉及的所有程序也要跟着修改, 不管该功能修改与该程序有没有关系, 工作量都不小。

由于接口是根据不同环境使用不同的接口描述语言, 接口与具体应用环境也呈紧耦合关系, 因此接口的移植、复用不容易。

(三) 面向服务体系结构的接口

解决问题的根本出路在于使用面向服务体系结构的接口。

根据SOA (Service-Oriented Architecture) 的概念, 面向服务的体系结构是一种体系架构组织模型。在计算机应用方面, 它的概念是将不同功能的应用程序 (称为服务) 通过这些服务之间定义良好的接口和协议联系起来。接口是采用中立的方式进行定义的, 它应该独立于实现服务的硬件平台、操作系统和编程语言。这使得构建在各种这样的系统中的服务可以以一种统一和通用的方式进行交互。

这种具有中立的、没有强制绑定在特定的环境上的接口定义, 可实现服务之间的松耦合。松耦合系统的好处是, 当组成整个应用系统的某个服务的内部结构或局部发生改变时, 其他服务可以无须变化。而紧耦合意味着应用程序不同组件之间的接口与其功能和结构是紧密相连的, 因而当需要对部分或整个应用程序进行某种形式的更改时, 它们相互牵连, 整个系统由于个别修改而显得非常脆弱。

可见, 不同功能单元的应用程序 (称为服务) 之间, 采用中立的方式进行良好定义的接口 (称之为标准接口) 进行互连, 是SOA一个关键的概念。

SOA的服务模块通常称之为构件。构件在提出服务请求、接受服务要求和返回服务结果时, 要采用标准接口。包括:

1. 标准的协议 (语言)

为了能更好支持相对自由格式的不定长的报文, 一般应使用自解释的协议 (例如XML) , 且该协议应被构件提供服务的对象广泛采用。使用自解释的协议, 可以使程序与接口之间实现松耦合。如前面所描述过的, 程序仅需要关心自己需要的东西, 通过接口转换逻辑, 可以把外部自由格式的接口转换成内部自己使用的固定格式的接口, 从而屏蔽掉与己无关的接口变化。

2. 标准的报文

使用上述语言表述的通用的有限种的报文。所谓通用, 指的是在一定范围内被大家广泛采用 (如IFX) 。所谓有限种, 指的是报文种类只有几十个到一百多个, 而不是成千上万个 (如ISO8583, 一共才几对报文) 。

报文通常成对出现, 分别是服务申请报文、服务结果返还报文。一个构件一般只对应有限对标准报文, 一对报文对应一类服务。服务的细项功能可以由报文内的功能码再细分。

在应用系统走向SOA的道路上, 其中最难和工作量最大的是接口标准化。因为这涉及所有接口的梳理、综合、重定义, 然后把成千上万的接口整理为几十到百多个接口;其中还涉及所有程序的改造, 因此可能带来的系统结构的变化。接口标准化一天未完成, 就一天不能满足SOA的最基本定义, 不管应用系统怎么样改造, 都算不上是SOA的系统。

六、外联设计

一个联机系统, 总要与外界其他系统连接。连接的形态一般有2种:一种是主叫连接, 如金卡工程他行卡在本行ATM取款时把处理要求送往他行;另一种是被叫连接, 如金卡工程本行卡在他行取款并由他行送过来的处理要求。

多联机系统的新风处理及其节能方式 篇5

相对于传统的中央空调系统, 多联机系统更接近单元式空调器或房间空调器, 但新风处理不如常规中央空调系统容易做到。研究多联机系统的新风供应方式及其节能具有非常重要的意义。

1 多联机系统新风供应方式

1.1 无组织新风

对于不设有组织新风系统, 仅靠门窗缝隙渗透, 甚至开窗引入新风的做法, 不是严格意义上的新风供应方式, 但由于实际工程中采用这种做法较多, 有必要予以分析。由于建筑物的风压、热压作用, 不同朝向、不同楼层的房间其渗入室内的空气量是不同的, 有些房间甚至打开外窗都不能有效引进新风。所引入的新风无论是其品质 (主要是洁净度) 还是针对每人所必须的新风量都无法保证, 直接从室外引入未经处理的新风, 增大了室内空调负荷, 对于一般按夏季冷负荷选择的室内机型号, 冬季严寒季节可能造成供热量不足。另外, 夏季新风的含湿量较高, 室内机除湿量增大, 室内相对湿度无法保证。总之, 靠缝隙渗透引入新风的做法无法保证空调房间的空气状况, 应尽量避免。

1.2 室内机自吸新风方式

通过选用室内机专用换新风组件, 将新风引入机组, 采用室内机自吸的方式送入室内。新风一般直接取自室外, 不经过温湿度处理 (有时经过简单的过滤) , 新风负荷由室内机承担, 室内机除湿负荷增大, 在高湿度地区室内湿度较难控制, 影响空调效果。新风管分层或集中设置, 室内机数量较少时, 新风管也可分机组设置。此种新风处理方式仅限于天花板卡式嵌入型、天花板嵌入风管内藏型的室内机。

1.3 采用专用新风处理装置

有些多联机厂商如日本大金产品中, 提供一种专门用来处理新风的室内机, 它仍然采用冷媒直接蒸发式制冷 (制热) , 具有一定的机外余压 (200 Pa左右) , 可以根据室外空气温度或室内外温差, 通过设在冷媒供液管路上的电子膨胀阀自动控制供液量, 通过变频控制达到设定的送风参数。表1是该型室内机的部分规格参数。

在新风处理中需注意, 不能将专用新风室内机与普通室内机连接在一个系统中, 也不能将普通天花板嵌入风管连接型室内机 (FXCP-MMVC) 作为新风机组使用。普通室内机处理室内空气, 而新风室内机处理室外空气, 空气状态相差甚远, 对设备的要求也不一样。夏季由于新风温度高, 冷媒盘管内蒸发压力也高, 压缩机功率消耗大, 如果把新风室内机与普通室内机共同连接一台室外机, 压缩机有可能因超载而烧毁。

由于机组的制冷、制热能力是一定的, 在不同室外状态下, 所处理的新风中状态参数是不同的, 应通过焓—湿 (hd) 图计算确定。但是2007年出版的技术措施节能转篇明确:当直流式空调系统的送风量不小于3 000 m3/h, 应当设计热回收装置, 进而对新风处理机组的应用有了限制, 所以有了第4种新风供应方式。

1.4 采用新风换气机

以下定量分析了显热回收式和全热回收式新风换气机的工作状况, 其结论如下:1) 新风换气机可以用于多联机空调系统供应新风, 并具有节能效果;2) 与采用专用新风处理装置相比, 新风换气机供应空调系统新风时, 夏季室内机负荷增加, 湿工况加重, 室内相对湿度有增加的趋势;3) 在冬季工况下, 新风换气机能较好满足空调系统需要, 节能效果显著;4) 全热回收装置与显热回收装置相比, 夏季工况全热回收型节能效果较好, 冬季工况二者差别不大;5) 采用全热回收装置冬季可减少空调加湿系统的费用, 对湿度要求不高的场合可以不需对新风加湿。

全热交换器目前市场产品较少, 选择受到一定限制, 并且价格较高。表2为大金HRV全热交换器的规格及性能参数。

国产新风换气机是一种显热回收装置, 显热回收效率在70%左右。由于新风换气机规格较多且价格低廉, 采用新风换气机解决多联机系统的新风供应, 比采用HRV全热交换器更为灵活。

2新风加湿

冬季空调系统中, 室内空气的升温过程是一个等湿加热过程, 空气被加热的温度越高, 其相对湿度越低。室内易产生静电, 影响人们的正常生活;木质地板、家具易干裂变形。

当采用新风换气机为VRV系统供应新风时, 由于冬季送风温度较低, 如北京地区在室外空调设计干球温度-12℃时, 送风温度仅为12℃, 如采用湿膜或超声波式、高压喷雾式等形式的等焓加湿, 即使加到饱和也无法达到设计要求, 只能采用等温加湿方式, 如干蒸汽加湿, 当无蒸汽来源时, 可采用专为新风换气机设计的电极或PTC电陶瓷加热的等温加湿装置。

该系列加湿器的工作原理是用PTC电陶瓷加热而产生的蒸汽输送到新风换气机的室内新风送风口处完成新风加湿过程。具有如下特点:1) 低温加湿性能好, 可在10℃左右的低温送风管道内完成等温加湿。2) 风阻力小, 蒸汽在PTC不锈钢箱体内产生后, 仅通过蒸汽管送到新风换气机的新风送风管内, 与干蒸汽加湿器的布置方式相同, 对送风系统基本没有影响。3) 耗水量小, 除定期进行排污外, 水全部转化为蒸汽。4) 使用安全, 无水时PTC电陶瓷表面温度不超过200℃, 不会像电热管一样易产生干烧火灾隐患。

3工程实例

莱索托议会大厦, 建筑面积7 000 m2, 5层, 建筑高度23 m, 属于低层建筑。工程设计夏季冷负荷700 kW, 设计冬季热负荷400 kW。空调系统形式:众议院会议厅由于有严格的新风要求, 所以除了采用多联机系统外还采用了新风换气机, 其余的办公用房采用大金VRVIII空调系统。室内机根据相应房间的布局形式采用半封闭四方型或隐藏管路型, 所有的室外机均设于主楼屋面上。

4结语

VRV空调系统应设置有组织的新风供应, 而新风换气机是一种较为理想的新风供应方式, 采用此种新风供应方式时可采用电极或PTC电陶瓷加热的等温加湿装置进行冬季加湿。

参考文献

基于数据仓库的联机分析处理技术 篇6

随着市场竞争的日趋激烈, 信息对于企业的生存和发展发挥着越来越重要的作用。与此同时, 在各个领域产生了大量的数据, 但是面对不断增加如潮水般的数据, 传统的数据库管理系统已无法满足决策支持系统对数据的要求, 因此人们提出了更深层次的问题:能不能从数据中提取信息或者知识为决策服务。在这种情况下, 一种适用于决策支持系统的数据组织与管理技术—数据仓库1技术应运而生。

1. 数据仓库技术

1.1 数据库到数据仓库的演变

传统的数据库与OLTP (On-Line Transaction Process) 平台并不是为了分析数据而设计的, 用户可以在一个OLTP平台上安装数个应用系统, 它在数据共享、数据与应用程序的独立性、维护数据的一致性和完整行及数据的安全保密性等方面提供了有效的手段。但是当它与分析型应用结合时, 却出现了许多问题。

首先, 利用传统的数据库进行数据分析, 分析的结果缺乏可靠性。其次, 利用传统的数据库进行数据处理, 其效率很低。第三, 传统的数据库难以将数据转化成信息。第四, 传统的数据库系统主要用于事务处理, 而在事务处理型的应用环境中直接构建分析决策型应用是不可能的。所以, 为了提高分析和决策的效率和有效性, 面向分析决策型应用的数据处理及其数据必须与事务处理型应用环境分离, 建立单独的分析决策型应用环境。数据仓库正是为了解决这一问题而诞生的一种数据存储和组织技术。

数据仓库与传统的数据库的不同之处在于数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合, 它可以支持企业或组织的决策分析处理2。

2. 联机分析处理技术

联机分析处理OLAP (On-Line Analytical Processing) 技术3是基于数据仓库进行数据分析的一种技术。OLAP可使企业数据分析人员、企业经理及企业其他管理人员通过对企业信息的多种可能的观察角度进行快速、一致和交互性的存取, 以获得对信息的深入理解。

2.1 OLAP的基本特性

OLAP是数据处理的一种技术概念, 其定义简单的概括为:共享多维信息的快速分析。OLAP通过对多维信息以很多种可能的观察方式进行快速、稳定一致和交互性的存取, 允许管理决策人对数据进行深入观察。其特点4有四个方面:

(1) 快速性。用户对OLAP的快速反应能力有很高的要求。要求系统能在几秒钟内对用户的多数分析要求做出反应;

(2) 可分析性。OLAP系统应能处理与应用有关的任何逻辑分析和统计分析;

(3) 多维性。多维性是OLAP的关键属性和灵魂, 系统能够提供对数据分析的多维视图和分析, 包括层次维和多重层次维的支持。

(4) 信息性。OLAP系统能够及时获得信息, 并且管理大容量信息;

(5) 共享性。共享性是在大量用户间实现潜在地共享秘密数据所必须的安全需求。

2.2 OLAP的基本分析操作

OLAP的基本操作是指通过对多维形式组织起来的数据进行切片、切块、聚合、钻取、旋转等分析动作, 以求剖析数据使用户能够从多种维度、多个侧面、多种数据综合度查看数据, 从而深入地了解包含在数据中的信息、内涵。

(1) 切片 (Slicing) 。

切片操作就是在某个或某些维上选定一个属性成员, 而在其他维上取一定区间的属性成员, 或全部属性成员来观察数据的一种分析方式。

(2) 切块 (Dicing) 。

切块就是在各个维上取一定区间的成员属性, 或全部成员属性来观察数据的一种分析方式。从另一个角度讲, 切块可以看成是在切片的基础上, 进一步确定各个属性成员的区间得到的片段体, 也即由多个切片叠合起来。

(3) 钻取 (Drilling) 。

钻取包含向下钻 (Drill-down) 和向上钻 (Drill-up) /上卷 (Roll-up) 操作。下钻指从概括性的数据出发获得相应的更详细的数据, 上钻则相反。钻取的深度与维度所划分的层次相对应。

(4) 旋转 (Pivoting) 。

旋转即改变一个报告或页面显示的维方向。旋转可能包含交换行和列, 或是把某一个行维移到列为中去, 或包页面显示中的一个维和页面外的维进行交换。

3. OLAP与数据仓库

在数据仓库中, OLAP和数据仓库是密不可分的, 但是两者是不同的概念。

数据仓库是一个包含企业历史数据的大规模数据库, 这些历史数据要用于对企业的经营决策提供分析和支持。数据仓库中的数据是不能用于OLTP的, 而OLAP则利用数据仓库中的数据进行联机分析, 将复杂的分析查询结果快速地返回用户。OLAP利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总, 用联机分析和可视化工具对这些数据迅速进行评价。

OLAP可用多级结构表示数据仓库中的数据, 创建组织和汇总数据的立方体, 这样才能有效的提高用户复杂查询的要求。因此数据仓库的结构将直接影响立方体的设计和构造, 也就影响了OLAP的工作效率。

从OLAP使用的效率角度考虑, 在设计数据仓库时应该考虑一下几个因素:

(1) 尽可能使用星型架构, 如果采用雪花结构, 就要最小化事实表底层维度表以后的维度表数量。

(2) 为用户设计包含事实表的维度表, 这些维度表应该包含有意义的、用户希望了解的信息。

(3) 度表的设计应该符合通常意义上的范式约束, 维度表中不要出现无关的数据。

(4) 事实表中不要包含汇总数据, 事实表中包含的用户需要访问的数据应该具有必需的粒度, 这些数据应该是同一层次的数据。

(5) 对事实表和维度表中的关键字必须创建索引, 同一中数据尽可能使用一个事实表。

(6) 保证数据的参考完整性, 使事实表中的所有数据都出现在所有的维度表中, 避免事实表中的某些数据行在立方体进行聚集运算时没有参加过来。

4. OLAP的发展

OLAP技术5是在市场竞争日益激烈, 决策人员迫切需要准确及时并且可以灵活访问的决策信息的背景下兴起的。其主要的发展领域为:

(1) 市场和销售分析

几乎每个商业公司都需要此类软件, 但其大规模分布在:生活消费品行业、零售业、金融服务业。此类行业通常都需要用发哦OLAP能够对大量数据进行复杂的分析和统计功能。

(2) 电子商务分析

电子商务网站记录了用户在网上的所有行为, 为更精细的分析用户行为提供了可能。一个典型的商业网站每天都产生大量的数据, 简单手工分析显然难以胜任, 用多维、分层OLAP可以很好的把这些数据组织起来。

(3) 基于历史数据的营销

通过各种不同的历史数据, 用数据挖掘或统计的方法, 找到针对某项服务或商品的销售对象。虽然传统上不是OLAP的范围, 但是通过多维数据分析的引入, 会取得更好的效果。

(4) 预算

预算通常是从下到上提交和从上到下约束的反复过程, OLAP工具可以在这个过程中提供分析能力。预算制定者利用OLAP提供的工具浏览市场、销售、生成及合并计划等企业全方位的数据, 得到一个较合理的方案, 也可以利用这些数据自动制定出方案。

(5) 财务报告与整合

早起的财务报告整合系统与现在OLAP相似, 但是OLAP利用对多维数据的分析能够更好的对其进行管理。

(6) 管理报告

(7) 利益率分析

(8) 质量分析

5. 小结

数据仓库和联机分析处理技术在市场竞争日益激烈的的背景下逐渐兴起, 目前正处于快速发展的阶段。文章首先对数据仓库和联机分析处理技术做了详细介绍并将它们和传统的数据库做了对比, 得出数据仓库和联机分析处理技术是在传统数据库无法到达设计者需求下产生的。文章最后对联机分析处理技术的发展领域做了介绍和分析。相信在不久的将来基于数据仓库的联机分析处理技术定会成为处理数据的主流技术。

参考文献

[1]武森、高学东等:数据仓库与数据挖掘[M].北京:冶金工业出版社, 2003年

[2] (美) W.H.Irmon著.数据仓库[M].王志海等译.北京:机械工业出版社, 2002年

[3]王珊等:数据仓库技术与联机分析处理[M].北京:科学出版社, 1998年

[4]喻钢, 周定康:联机分析处理 (OLAP) 技术的研究[J].成都:计算机应用, 2001, 21 (11)

联机分析处理系统 篇7

信息技术的迅速发展和企业管理决策的迫切需要, 使数据仓库理论应运而生。企业根据自身特点, 建立起内容完备、结构合理的数据仓库后, 还必须使用适当的技术和工具, 对数据仓库存储的数据进行全面、透彻的分析, 最终实现决策支持的目标。否则, 大量的数据可能成为包袱, 甚至成为垃圾。联机分析处理 (OLAP) 就是基于数据仓库的一种最重要的分析工具;OLAP的基本思想是使企业的决策者能灵活地、从多个角度以多维的形式来观察企业的状态和了解企业的变化。因此, 开展对OLAP的应用方法和技巧的研究, 对有效发挥数据仓库的功能、支持企业决策具有重要的意义。

1 关系型联机分析处理ROLAP简介

1993年, 数据仓库之父W.H.lnmon将数据仓库定义为:“一个面向主题的、集成的、随时间变化的、非易失性的数据集合, 用以支持管理层的决策”。同时也提出了多维分析的概念, 即联机分析处理OLAP。联机分析处理的过程是根据数据分析的要求, 从数据仓库中某个特定主题的集成数据出发, 通过直观的方式从多个角度、多个层次及多种数据综合程度对数据进行分析、比较, 对经过多维组织后的数据进行切片、切块、聚合、钻取、旋转等分析操作, 并以直观易懂的形式将结果返回给用户, 使用户了解数据背后蕴含的规律。

联机分析处理 (OLAP) 系统按照存储器对数据存储格式不同, 可以分为关系OLAP (ROLAP) 、多维OLAP (MOLAP) 和混合型OLAP (HOLAP) 三种类型。

顾名思义, 关系型联机分析处理 (ROLAP) 是以关系型数据库为基础的联机分析处理。特别之处在于联机分析处理中的数据结构组织的方式。ROLAP将分析用的多维数据存储在关系数据库中并根据应用的需要有选择的定义一批实视图, 作为表也存储在关系数据库中。星型数据模型是重要的数据结构组织的方式。

虽然MOLAP是为OLAP量身订制, 具有一定的特色和优势。但是, ROLAP由于能充分利用关系数据库成熟的理论和完整的技术, 适应性强, 因而被广泛应用。

2 数据仓库和联机分析处理数据模型的建立

以多维数组为基础的多维数据模型, 也叫数据立方体, 是数据仓库对数据组织的模式, 也是联机分析处理 (OLAP) 的基础。正是多维数据模型, 把数据仓库和联机分析处理 (OLAP) 紧密地联系在一起, 使各自的功能得以有效地发挥。数据仓库是OLAP的基础, 而OLAP是数据仓库的应用。因此, 多维数据模型是决策支持的支柱, 也是OLAP的核心。

星型数据模型是数据仓库和联机分析处理使用的最基本、最常用的数据模型。它能准确、简洁地描述出实体之间的逻辑关系。建立多维数据模型, 一般都是在对应用主题分析的基础上, 首先建立星型模型。

一个典型的星型模型包括一个大型的事实表和一组逻辑上围绕这个事实表的维度表。事实表是星型模型的核心, 事实表由主键和度量数据两部分组成。星型模型中各维度表主键的组合构成事实表的主键。事实表中存放的大量数据, 是同主题密切相关的、用户最关心的度量数据。维度是观察事实、分析主题的角度。维度表的集合是构建数据仓库数据模式的关键。维度表通过主键与事实表相连。用户依赖维表中的维度属性, 从事实表中获取支持决策的数据。

现通过一个具体实例——星级酒店经营数据仓库 (集市) , 分析星型数据模型的结构和建立。

星级酒店最需要关注客户的消费情况。在星级酒店经营数据集市星型数据模型中, 基础事实表中需要记载的是客人最低粒度的消费事实。即:用何种促销手段使某位客人在某个时间进行了何种形式的消费, 消费金额产多少。因此, 在事实表中, 要准确记载每位客人的消费形式、消费价格、促销方式、促销折扣、消费金额、成本、利润等度量数据。

围绕经营主题, 星级酒店经营数据集市有以下典型的维度及其属性:

客户维:在客户维中, 需要建立客户的基本信息。为决策分析需要, 把客户分为常住客户和流动客户。

消费项目维:经营星级酒店, 要向客人提供高质量的消费, 消费项目多种多样。把经常性的消费项目归纳为:客房、餐饮、娱乐、其他等四类。每类消费都有消费内容的细节描述。

时间维:在数据仓库的多维数据结构中, 时间维往往是不可少的一个维度。因为每项“销售事实”都是在一定的时间或者时间段内发生。针对需求, 时间维采用时、日、月、年四个属性。

促销维:行业的竞争, 使各酒店都采用了形形色色的促销方式。促销增加了了营业额, 但同时也增加了运营成本。促销的形式和效果, 对管理者的决策具有重要价值。在促销维中描述了几种典型的促销方式:广告、打折、中介、联营等作为维度属性。根据决策需求, 建立星级酒店经营数据集市星型数据模型, 如图1所示。星型模型为演变生成雪花数据模型奠定了基础。

3 联机分析处理的切片和切块操作

ROLAP的基本操作, 是在多维数据模型的基础上, 通过数据的聚集和汇总, 从多维数据中取出二维或三维数据 (切片、切块) 进行分析, 或对维的不同层次进行钻取操作, 从而获取支持决策的数据。

3.1 ROLAP切片操作

在联机分析处理中, 选定多维数组的一个二维子集的操作叫切片。即:在多维数组的某两个维上分别选取一定区间或全部的维成员, 而在其他维上均选定一个维成员后, 得到的结果。用此方法, 可以得到很多支持决策的切片。例如, 对图1所示的多维数据模型进行切片操作:

把时间维选定为“年”, 客户维选定为“常住客户”, 得到的切片所揭示的问题是:星级酒店一年中, 常住客户的销费情况同促销手段之间的联系。如图2所示。

把时间维选定为“年”, 促销维选定为“打折”, 得到的切片所揭示的问题是:星级酒店一年中, 通过“打折”, 客户在消费方面的增长情况;

把时间维选定为“年”, 消费项目维定为“客房”, 得到的切片所揭示的问题是:星级酒店一年中, 各种促销手段对客房经营的影响。

3.2 ROLAP切块操作

在联机分析处理中, 选定多维数组的一个三维子集的操作叫切块。即:在多维数组的某三个维上分别选取一定区间或全部的维成员, 而在其他维上均选定一个维成员后, 得到的结果。例如, 对图1所示的多维数据模型进行切块操作:把时间维选定为“年”, 客户维、促销维、消费项目维都选全部维成员, 得到如图3所示的“切块”。这是一个真子集的数据立方体, 数据立方体中的数据是已经过处理并聚合成立方形式。因此, 通常不需要在数据立方体中进行计算。我们不仅可利用这个数据立方体进行决策分析, 还能通过这些“切块”也可得到决策需要的“切片”。

切片和切块操作的目的是降低多维数组集的维, 以便更好地了解多维数据集。使人们能将注意力集中在较少的维上进行观察。在实际应用中, 对每一个多维数组, 都可以根据决策分析的需要, 将一些维定格到一个维成员, 使多维数组简化为“切片”或“切块”。

建立在数据立方体基础上的OLAP技术以多维分析为基础, 刻画了管理和决策过程中对数据进行多层面、多角度分析处理的基本要求, 满足了实际的需求, 为企业管理和决策活动提供了一个新的工具, 也为决策支持系统的研制提供了新的思路。

4 联机分析处理的钻取操作

在联机分析处理操作中, 钻取是改变维的层次, 变换分析粒度的操作。它包括向下钻取和向上钻取。向下钻取使用户在多层数据中获得更多的细节数据;向上钻取使用户在多层数据中获得更多的概括性的数据。

4.1 建立数据集市聚集事实表的必要性

为了提高聚集查询响应速度, OLAP经常预先计算大量的聚集。利用聚集事实表能快速、方便地获取钻取结果。

“聚集”是从最低粒度的事实表中衍生出来的预先计算的汇总数据。这些汇总数据形成了一组独立的聚集事实表。实际应用中, 可以根据需要用跨越任何维度的特定的汇总数据构建为一个聚集事实表。

数据仓库基础事实表存储的是大量历史、最小粒度的基本数据。联机分析处理需要通过汇总和聚集机制, 为管理者提供具有决策价值的汇总数据。查询优化是提高OLAP响应速度的关键。目前最有效的方法是增加综合数据存储及查询方式的优化。因此, 把使用频率高的汇总数据存放在聚集事实表中, 对提高数据集市的使用性能, 为管理者提供决策支持, 使用户获得更好、更快的查询结果, 是非常必要的。数据集市聚集模型的好坏将在很大程度上影响到数据集市的使用效果。

4.2 怎样建立聚集事实表

在数据集市中建立聚集事实表, 要注意以下原则:

⑴每一个不同的聚集必需使用单独的事实表存储聚集数据, 成为相对独立的聚集事实表。

⑵聚集事实表中的维表必须是基本事实表中的维表的压缩。

⑶基本事实表中的度量数据加载后, 才能作聚集处理。

4.3 星级酒店数据集市常用的聚集事实表

每一个数据仓库 (数据集市) , 都可能有多个维度表。因此, 一个数据仓库 (数据集市) 会有很多个聚集事实表。究竟需要哪些聚集, 要针对用户需求和决策需要。例如, 为了满足钻取需要, 星级酒店数据集市可分别按每一个维的不同层次或不同类别建立以下单路聚集事实表:

在时间维:分别对月、季、年进行单路聚集;

在客户维:分别对常住客户和流动客户进行单路聚集;

在消费形式维:分别对客房、餐饮、娱乐、其它进行单路聚集;

在促销维:分别对不同的促销方式进行单路聚集。

根据决策需要, 还可以建立二路、三路、四路聚集事实表。

4.4 聚集事实表在联机分析处理操作中的应用

(1) 、向下钻取。确定需要分析的问题, 该沿着某个维度进行钻取以及钻取开始的层次和钻取到达的层次。调用相应的聚集事实表进行对比, 就可得到在指定维度上的细化, 从而为决策分析提供依据。

(2) 、向上钻取。向上钻取是向下钻取的逆过程, 调用相应的聚集事实表进行对比, 就可得到在指定维度上的泛化。

4.5 建立汇总表

为了改善数据汇总查询的性能, 可以建立一个汇总表, 将常用的星级酒店营销数据集市的全部聚集事实表的表名、粒度、相应的维度属性存放在汇总表中, 并通过数据仓库元数据进行管理。这样, OLAP就能根据汇总表的指示, 选用不同粒度的聚集事实表进行切片、切块、聚合、钻取、旋转等操作, 有效地提高了查询和分析速度。弥补了ROLAP在查询速度方面的不足。

此外, 联机分析处理中的旋转操作, 是将多维数据集中的不同维进行交换显示, 以使用户更加直观地观察不同维之间的关系。

5 结束语

设计和构建成一个好的多维数据模型, 为开展联机分析处理的基本操作奠定了基础。OLAP的切片、切块、聚合、钻取、旋转等基本操作, 既是对数据仓库数据展示的方法, 也是获取数据信息的手段。从广义上讲, 任何有助于帮助用户理解和分析数据仓库数据的技术或操作都可以作为OLAP的功能, 因此, 对OLAP的更深入研究还任重道远。

参考文献

[1]InmonWH著.王志海, 林友芳等译.数据仓库, 第三版.北京机械工业出版社.2003年

[2]李林花.等.数据仓库多维分析模型的设计[J].计算机工程与应用.2004, 40.

[3]刘旭东.数据仓库的oLAP研究[J].电脑知识与技术.20o5 (17)

联机分析处理系统 篇8

研究表明, 设计过程只占产品总成本的5%左右, 却决定了占总成本70~85%的产品质量、成本、可制造性和可维修性等因素。如何利用设计对产品生命周期后续阶段的决定性影响来降低产品成本、提高产品质量成为设计过程研究的核心问题。设计过程与产品生命周期后续阶段的关系类似于生物基因与生物性状之间的关系, 即基因决定性状。生物相关学科的研究显示, 同种类生物基因的相似度很高, 如同属灵长类动物的人和黑猩猩的基因相似度高达99%。类似地, 同种类产品的设计过程涉及很多相同或相似的设计过程知识, 如果从同类产品的设计过程中将这些相同或相似的设计过程知识提取出来, 组织成若干个设计过程基因, 则这些设计过程基因分别决定了产品的不同性状, 如质量、可制造性、可维修性等。通过修改设计过程基因, 可进行设计过程的优化和重用, 从而提高设计过程的效率和质量, 进而提高产品全生命周期质量并降低成本。

应用生物基因方法进行的设计过程优化和重用研究主要集中在产品基因等的理论研究及以此为基础的产品创新设计方法上。在产品基因研究方面:Jone.S.Gero[1~3]等将遗传原理、基因工程和发展生物学的思想引入工程设计过程, 提出了进化设计基因的概念;K.Z.Chen[4,5]等提出制造产品虚拟基因和产品虚拟染色体的概念并研究了其特征和组成结构;黄克正等[6~8]对产品基因的概念、特征、提取、重构和建模进行了研究;顾新建等[9,10]对产品基因的特征、分类、遗传、重组和建模进行了研究, 冯培恩等[11,12]对产品基因的遗传机理进行了研究。在基于产品基因的创新设计方法方面:Vajna[13]将产品在设计过程中的产生类比于有机体的进化过程, 提出了自生设计理论 (Autogenetic Design Theory) 及其一般活动模式;K.Z.Chen[4~6]等在虚拟基因识别的基础上建立虚拟染色体组地图, 提出以虚拟产品基因重组为核心的生物设计理论与方法 (Bionic Design Theory and Methodology) 。

这些研究的共同点是通过对产品基因特征与类型的研究, 提取出同类产品的遗传基因, 通过对产品基因的继承和重构, 设计出高质量的产品。

联机分析处理 (Online Analytical Processing OLAP) 是数据仓库提供的用于分析多维数据的工具, 它从数据仓库中的集成数据出发, 构建面向分析的多维数据模型, 利用这个带有普遍性的数据分析模型, 用户可以使用不同方法, 从不同角度对数据进行分析[15]。OLAP的三个主要特点及其在设计过程基因存储和表示中的优点如下:

1) 将数据集看作多维数组。该特点支持对设计过程基因各级结构 (设计过程碱基、碱基对和设计过程基因) 数据的描述和存储。设计过程碱基、碱基对以及过程基因均具有多个维度的属性, 可以表示成多维数组的形式。

2) 关注交互式数据分析, 提供可视化数据和产生汇总统计的广泛能力。该特点支持对过程碱基到过程基因的形成过程的处理。过程基因的形成过程可看作OLAP对过程碱基多维数组进行分阶段持续深入处理的过程。从过程碱基形成过程碱基形成过程基因的过程可看作过程碱基序列多维数组经过OLAP处理得到过程基因多维数组的过程。

3) 实现了分析方法和数据结构的分离。该特点支持对所分析数据和分析结果进行独立存储, 便于与企业已有数据库和数据管理系统进行集成。考虑到目前企业应用最广泛的数据库形式是关系数据库, 为方便与关系数据库的集成和提高OLAP的工作效率 (如果使用多维数据库技术, 一旦需要增加新的维度, 必须重建该多维数据库) , 分别将过程碱基和过程基因以多维数组的形式表示并存储在关系数据库中。

本研究从设计过程优化和重用的角度出发, 在分析设计过程基因结构和功能原理的基础上, 研究如何利用联机分析处理技术进行设计过程基因的存储和表示。

1 设计过程基因的结构和功能原理

设计过程基因决定设计过程性状, 是设计过程遗传的基本单位。设计过程基因是相同或相似的设计过程知识按照一定规则组织起来的虚拟单元, 本质上是人为构造的知识要素及其关系的集合。按照生物基因的组织规则构造设计过程基因, 则设计过程基因是设计过程碱基的有序排列。设计过程碱基是设计过程基因的基本结构单元, 每个设计过程碱基都是同种类的设计过程知识及其关系的集合。初步研究认为设计过程碱基包括四种类型, 分别是设计对象碱基、设计资源碱基、设计团队/成员碱基和设计活动碱基 (见参考文献[14]) 。

设计过程基因就是具有一定长度的设计过程碱基序列。不同类型的设计过程碱基之间按照一定规则两两匹配形成设计过程碱基对 (如图1所示) , 表示不同种类的设计过程要素之间的相互作用。设计过程碱基对按照一定规则排列形成设计过程碱基序列。设计过程基因能够决定设计过程性状是由于设计过程碱基序列的排列方式蕴含了产品设计过程的遗传信息, 即设计过程要素的相互作用过程及顺序。

基于设计过程基因的设计过程优化和重用原理如图2所示。

首先, 从已完成设计的相似产品的设计过程记录和文件中提取设计过程知识, 存入设计过程知识库;然后, 按照设计过程基因结构 (遵循“设计过程碱基—设计过程碱基对—设计过程基因”的顺序) 构造并提取若干设计过程基因, 存入设计过程基因库;进行新产品设计时, 从设计过程基因库中继承所需的设计过程基因, 并根据设计要求添加新的设计过程基因和 (或) 修改原有的设计过程基因, 形成新的设计过程基因组;最后, 通过设计过程基因翻译和表达, 形成新的设计过程, 体现新的设计过程性状。

2 设计过程碱基多维数据

2.1 设计活动碱基多维数据

构成设计活动碱基的要素可看作设计活动碱基数据的维 (Dimension) , 要素的取值是维的度量值 (Measure) 。设计活动碱基是关于设计活动要素属性的集合, 基本的设计活动包括:产生活动、分析活动和评价活动, 每种设计活动都有五种属性及相应的属性值, 因此设计活动碱基数据具有多维结构, 可以用数据的多维概念视图表示。维度和变量组成设计过程碱基三维数组, 如式 (1) :

式 (1) 用三维立方体直观表示, 如图3所示。

2.2 设计对象碱基多维数据

设计对象碱基是关于设计对象要素及其关系的集合, 包括:设计问题、设计方案以及两者之间的共同进化关系。其中, 设计问题和设计方案具有相同的属性名称, 可用一个三维数组表示, 而共同进化关系的属性维与前两者不同, 需用一个单独的三维数组表示。因此, 设计对象碱基可以用三维数组的集合表示, 如式 (2) :

设计对象碱基=[设计问题和设计方案三维数组, 共同进化关系三维数组]

=[ (设计阶段, 设计问题和设计方案, 属性) (设计阶段, 共同进化关系, 属性) ] (2)

式 (2) 用三维立方体直观表示, 如图4所示。

2.3 设计团队/成员碱基多维数据

设计团队/成员碱基本质上是关于设计团队/成员要素及其关系的集合, 包括成员情况、成员角色/职能、成员专业职能和组织结构, 表示为多维数组集合如式 (3) :

设计团队/成员碱基=[设计成员情况多维数组, 成员角色/职能多维数组, 成员专业职能多维数组, 设计团队成员多维数组]

2.4 设计资源碱基多维数组

设计资源碱基本质上是关于设计资源要素及其关系的集合, 设计资源包括数据/信息/知识和工具 (如硬件、软件等) 。设计资源碱基可表示为多维数组集合如式 (4) :

设计资源碱基=[数据/信息/知识多维数组, 工具多维数组]

3 设计过程基因多维数据的关系数据库表示

设计过程基因多维数据的关系数据库表示由1张维表和14张事实表组成, 如图5所示。设计过程基因维表包含的信息分为四部分:

1) 基本设计过程信息。包括设计项目编码、设计阶段序号。

2) 与过程基因类型相关的信息。包括过程基因类型编码, 产品类型编码和设计类型编码。

3) 影响过程基因翻译的信息。包括设计目标类别编码和设计约束类别编码。

4) 影响过程基因表达的信息。包括过程碱基对序列类别编码, 过程基因排列规则编码和过程碱基对序列排列规则编码。

1 4张事实表分别对应四种设计过程基因信息。其中, 表示“设计过程碱基对序列类别”、“设计过程基因类别”、“设计目标类别”和“设计约束类别”的事实表分别有与之相连的“详细类别”事实表, 分别表示它们各自的大类能够被分成小类, 说明过程基因的“维”具有层次性。如公共设计过程基因是“设计过程基因类别”维中的一类, 而公共设计过程管理基因位于与“设计过程基因类别”事实表相连的“详细类别”事实表中, 表示它是公共设计过程基因一个子类, 从而表明“设计过程基因类别”维具有层次性。

4 结论

在基于基因工程的设计过程重用和优化方法框架下, 将联机分析处理技术应用于设计过程基因的存储和表示, 建立了设计过程碱基的多维数据结构, 提出以关系数据库存储和表示设计过程碱基对和设计过程基因的方法。该方法具有以下两个突出优点:

1) 充分利用了联机分析处理技术基于多维数据结构的特点, 以多维数据结构存储包含了多个不同要素的设计过程碱基, 全面、清晰地体现了设计过程碱基内部各个要素构成及其相互作用关系。

2) 支持从过程碱基到过程基因的动态处理, 节省空间, 提高了系统运行效率。

上一篇:幼儿园早操下一篇:教案反思