数据库

2024-06-24

数据库(精选十篇)

数据库 篇1

1 GIS数据库概念分析

1) 在当前形势下, 由于科学技术在不断的发展, 尤其在计算机技术领域方面以及在系统信息, 数据库等方面的实践研究都已经得到了很大程度的提升, 并且也取得了一定的成功, 这也就促使人们在应用地理信息时不会仅限在单一的产品中了, 而会把计算机的有效管理应用在更为繁琐的地理信息当中, 同时便将经济与社会当中的所有信息等方面进行有效的叠加, 从而取得更大的价值, 并且把效益放大化, 获得良好的成绩, 所以, 这就产生了GIS的产业发展与相应的理论研究。然而, 在这其中我们要清楚, GIS所应用的基础必须基于系统信息, 而它的基础则是建立在相关联的数据库上。我们要清楚, GIS是和其他的系统相同的, 都具有同样的特性, 所以在设计上应该遵守相应的设计。由于GIS的技术服务不仅仅是地图产品, 他还具有更多的实用功能, 他可以对地理信息以及对其全面的整合都具有很大的帮助, 比如在统计信息、检索、管理以及在分析方面等都比较突出;

2) 我们在认识地理信息以及依赖和利用这方面的知识已经具有很长的历史了, 而最为有效的应用就是相关的地图信息, 因此, 在进行研究时我们发现, 地图历史要早于文字, 并且他应用了地图的语言以及相关的数学法则的综合应用, 把世界客观的一面通过地图加以呈现, 但是从实质上我们看出, 他是通过应用符号、公式化以及更为抽象的表现出客观世界, 因此, 通过地图表现, 我们才可以更为真切的对生存环境做进一步的认识, 同时也借助于了有效又其简单的工具, 看到了客观世界, 这种信息的传递以及认知能力是无法替代的, 所以, 不管我们未来会发展成怎样, 都离不开地图的应用, 依赖于他;

3) 在GIS数据库当中, 他所存储的一般都是地理信息, 其中包括有属性图形数据等, 并且具有不同的特征, 比如有分辨率和数据的精准度, 一种是描述尺度的, 另外一种是描述数据的精准度的, 对此, 我们可以看出, 在GIS数据库当中已经不再显示比例尺了, 所以, 他不具有这方面的意义的, 也就是说, 如果指地名时, 只代表一种社会信息, 并不代表其它意义, 所以, 也可以说是地理信息。而所谓的比例尺也只不过指的是地图数据库的一种特征。在一般情况下我们所说的比例尺, 也就是地图数据库, 并不是所说的GIS。通常GIS我们是把他当成一个信息仓库, 所反映出的信息是更为真实和直接的, 并不是在特定要求下所反映出来的。

2 地图数据库

地图数据库是大不相同于GIS数据库的, 他是带有一定的比例尺概念, 并且建立了一个具有特定比例尺的仓库, 如果需要应用更多的比例尺地图时, 就要进行建立更多的数据库, 如果条件允许, 也可以建立几个分支数据库, 方便管理。一般情况下, GIS可以管理地图数据库, 我们也可以建立专门系统对其进行管理。在管理过程当中, 对地图数据库的管理模式需要应用简单模式, 也就是一幅图可以配备一个文件。此外, 在地图数据库当中, 会带有一定的图形属性表现, 这主要包括有大小、文字、符号、图层、线型以及粗细等方面。而一般在GIS数据库当中是不会体现出这些属性的, 他只是针对一些规范要求和图式来改变的, 并不代表专一性, 也没有体现出更多的属性。在地图数据库当中, 产品的管理都是具有相应的标准模式的, 都是电子产品, 所以就会保留他们的各种本质特点, 但是, 怎样对其进行分层管理, 对其进行有效的编辑, 并且显示出必备的图层以及印刷颜色的要求以及对大小进行无限修改, 拼接或裁切和量测等方面进行有效的调整。在其它方面, 如果需要更新地图数据库时, 也可以针对部分进行有调整的更新变化, 从而减少电子地图的调整时间。在一般的情况下, 地图数据库在更新方面会很慢, 属下游产品, 在更新方面还取决于GIS数据库, 并不是取决它的上游数据源, 他们之间的关系属于单向。由于在地图当中会存储大量的信息, 而这些信息都是通过过人为进行修改和编辑的, 所以我们所看到的这些信息都不是现实世界当中所反映出来的真实特点, 更不是在GIS数据库当中的真实内容了。

3结论

当前, 信息社会随着不断的进步与发展, 我们应用的GIS是作为集合了所有的地理空间以及和所有的信息统计相结合的系统, 它也是作为信息传送的重要基础设施。在我国, 由于建设GIS技术已经发展了多年, 并且很多专家在这种技术方面也已经更为深入的进行了研究, 并且已经取得了一定的进展, 也具有一定的突破, 并且应用在相关的单位当中。虽然与国外相比较仍然会存在一定的差距, 还需要不断的学习和研究, 我们很多科技人员在近些年以来都在开发GIS的数据库系统, 并且也取得了一定的成效, 这也为以后的成功发展奠定了很大的基础。

参考文献

[1]施一军.基于GIS技术建立地图数据库的构想和实现[J].测绘通报, 2011 (1) .

[2]郭仁忠.关于空间信息的哲学思考[J].测绘学报, 23 (3) .

[3]陈泽民.子地图的数据交换 (CNSDTF) 实现[J].现代测绘, 26 (3) .

Oracle数据库碎片数据库 篇2

我们知道, Oracle 作为一种大型数据库,广泛应用于金融、邮电、电力、民航等数据吞吐量巨大,计算机网络广泛普及的重要部门。对于系统管理员来讲,如何保证网络稳定运行,如何提高数据库性能,使其更加安全高效,就显得尤为重要。作为影响数据库性能的一大因素 -- 数据库碎片,应当引起 DBA 的足够重视,及时发现并整理碎片乃是 DBA 一项基本维护内容。

1 、碎片是如何产生的

---- 当生成一个数据库时,它会分成称为表空间( Tablespace )的多个逻辑段( Segment ),如系统( System )表空间 , 临时( Temporary )表空间等。一个表空间可以包含多个数据范围( Extent )和一个或多个自由范围块,即自由空间( Free Space )。

---- 表空间、段、范围、自由空间的逻辑关系如下:

---- 当表空间中生成一个段时,将从表空间有效自由空间中为这个段的初始范围分配空间。在这些初始范围充满数据时,段会请求增加另一个范围。这样的扩展过程会一直继续下去,直到达到最大的范围值,或者在表空间中已经没有自由空间用于下一个范围。最理想的状态就是一个段的数据可被存在单一的一个范围中。这样,所有的数据存储时靠近段内其它数据,并且寻找数据可少用一些指针。但是一个段包含多个范围的情况是大量存在的,没有任何措施可以保证这些范围是相邻存储的,如图〈 1 〉。当要满足一个空间要求时,数据库不再合并相邻的自由范围(除非别无选择),而是寻找表空间中最大的自由范围来使用。这样将逐渐形成越来越多的离散的、分隔的、较小的自由空间,即碎片。例如:

2 、碎片对系统的影响

---- 随着时间推移,基于数据库的应用系统的广泛使用,产生的碎片会越来越多,将对数据库有以下两点主要影响:

---- ( 1 )导致系统性能减弱

---- 如上所述,当要满足一个空间要求时,数据库将首先查找当前最大的自由范围,而 “ 最大 ” 自由范围逐渐变小,要找到一个足够大的自由范围已变得越来越困难,从而导致表空间中的速度障碍,使数据库的空间分配愈发远离理想状态;

---- ( 2 )浪费大量的表空间

---- 尽管有一部分自由范围(如表空间的 pctincrease 为非 0 )将会被 SMON (系统监控)后台进程周期性地合并,但始终有一部分自由范围无法得以自动合并,浪费了大量的表空间。

3 、自由范围的碎片计算

---- 由于自由空间碎片是由几部分组成,如范围数量、最大范围尺寸等,我们可用 FSFI--Free Space Fragmentation Index (自由空间碎片索引)值来直观体现:

FSFI=100*SQRT(max(extent)/sum(extents))*1/SQRT(SQRT(count(extents)))

---- 可以看出, FSFI 的最大可能值为 100 (一个理想的单文件表空间)。随着范围的增加, FSFI 值缓慢下降,而随着最大范围尺寸的减少, FSFI 值会迅速下降。

---- 下面的脚本可以用来计算 FSFI 值:

rem FSFI Value Compute

rem fsfi.sql

column FSFI format 999,99

select tablespace_name,sqrt(max(blocks)/sum(blocks))*

(100/sqrt(sqrt(count(blocks)))) FSFI

from dba_free_space

group by tablespace_name order by 1;

spool fsfi.rep;

/

spool off;

---- 比如,在某数据库运行脚本 fsfi.sql, 得到以下 FSFI 值:

TABLESPACE_NAME FSFI

------------------------------ -------

RBS 74.06

SYSTEM 100.00

TEMP 22.82

TOOLS 75.79

USERS 100.00

USER_TOOLS 100.00

YDCX_DATA 47.34

YDCX_IDX 57.19

YDJF_DATA 33.80

YDJF_IDX 75.55

---- 统计出了数据库的 FSFI 值,就可以把它作为一个可比参数,

在一个有着足够有效自由空间,且 FSFI 值超过 30 的表空间中,很少会遇见有效自由空间的问题。当一个空间将要接近可比参数时,就需要做碎片整理了。

4 、自由范围的碎片整理

---- ( 1 )表空间的 pctincrease 值为非 0

---- 可以将表空间的缺省存储参数 pctincrease 改为非 0 。一般将其设为 1 ,如:

alter tablespace temp

default storage(pctincrease 1);

---- 这样 SMON 便会将自由范围自动合并。也可以手工合并自由范围:

alter tablespace temp coalesce;

5 、段的碎片整理

---- 我们知道,段由范围组成。在有些情况下,有必要对段的碎片进行整理。要查看段的有关信息,可查看数据字典 dba_segments ,范围的信息可查看数据字典 dba_extents 。如果段的碎片过多,将其数据压缩到一个范围的最简单方法便是用正确的存储参数将这个段重建,然后将旧表中的数据插入到新表,同时删除旧表。这个过程可以用 Import/Export (输入 / 输出)工具来完成。

---- Export 命令有一个(压缩)标志,这个标志在读表时会引发 Export 确定该表所分配的物理空间量,它会向输出转储文件写入一个新的初始化存储参数 -- 等于全部所分配空间。若这个表关闭, 则使用 Import ()工具重新生成。这样,它的数据会放入一个新的、较大的初始段中。例如:

exp user/password file=exp.dmp compress=Y grants=Y indexes=Y

tables=(table1,table2);

---- 若输出成功,则从库中删除已输出的表,然后从输出转储文件中输入表:

imp user/password file=exp.dmp commit=Y buffer=64000 full=Y

---- 这种方法可用于整个数据库。

---- 以上简单分析了 Oracle 数据库碎片的产生、计算方法及整理,仅供参考。数据库的性能优化是一项技术含量高,同时又需要有足够耐心、认真细致的工作。

部署数据库,别忘了数据库选件 篇3

实际上,数据库厂商在数据库之外都提供了非常丰富的选件以响应各种各样的应用需求。以Oracle数据库为例,除了常规的数据库(比如标准版和企业版)之外,还有很多选件可以选配,比如大名鼎鼎的内存计算就是选件之一。

“数据库与数据库选件的关系类似于单反相机的机身与镜头之间的关系,一个好的相机除了机身之外,还必须配上合适的镜头,数据库也是如此。除了数据库本身之外,还需要搭配合适的选件来支持业务的运行。”甲骨文公司副总裁、中国区技术产品事业部总经理吴承杨告诉记者。

吴承杨介绍说,Oracle数据库选件根据其应用场景的不同大体可以分为三类,即高可用选件、高性能选件和高安全选件。具体而言,在高可用性方面,应用最为普及的选件非Oracle Real Application Cluster(即RAC)莫属。吴承杨说,几乎所有重要系统数据库都采用了RAC架构。因为RAC拥有可伸缩性、自动负载均衡和自动存储管理功能,使数据库可自由扩展。而GoldenGate选件是另一个应用得比较普遍的选件。GoldenGate通过将数据源和目标分离开来以提供异构支持,可在所有主要平台上的各种关系型数据库、开放系统/开源数据库与原有数据库之间捕获和交付数据,帮助企业消除数据延迟,同时降低数据灾难。

而在高性能方面,数据分区技术(Oracle Partitioning)、内存计算技术(Oracle Database In-Memory)以及数据库自动诊断和调优技术都应用得非常广泛。比如,Oracle Partitioning 可以按照时间、地域、状态等进行分区,将大型表分成多个单元,从而有效地帮助企业提高数据处理能力和管理能力,有效地管理数据的生命周期。而内存数据库选件则突破了行列限制,采用双格式数据库内存,能够帮助企业更快、更好地做出业务决策。

另外,在高安全性方面,Oracle数据库提供的Oracle Audit Vault and Database Firewall如同带有自动识别功能的监控探头,可监控Oracle和非Oracle数据库流量,并且能够检测和阻止威胁。此外,而针对企业的重要敏感信息,Oracle Advanced Security是最经济高效的全方位数据保护解决方案,它可以对信用卡号、社会保险号或个人身份信息等重要敏感信息加密。

有必要强调的是,选配数据库选件不一定都要多花钱,有时候还可以帮助省钱,也就是以较小的投入换取较大的回报。比如,低劣应用会对数据库的高效运行造成瓶颈,Oracle Enterprise Manager 选件可以实现故障的快速发现、自动诊断,并为数据库提供实例级解决方案,有效地帮助数据库提升管理效率、消除性能瓶颈、降低IT管理成本,交付高质量服务。

数据库课程中案例数据库的优化设计 篇4

国内主流数据库课程教材在组织内容时,虽然有的侧重数据库实现原理的介绍,有的以某一数据库管理系统(如Oracle、 My SQL等)为平台介绍数据库技术的应用,有的兼顾理论和技术,但无一例外都引入了一个或多个数据库教学项目作为贯穿全书各章节、演示数据库关键概念和技术的案例。许多在教学中广泛使用的案例数据库较为简单,与实际工程项目相差较大,不能很好地覆盖数据库课程所有知识点,导致学生在未来工作中遇到实际项目时无法快速上手。如何设计合理的教学案例数据库已成为数据库课程教学亟待解决的重要课题。

1主流数据库课程教材使用的案例数据库分析

下面从本专科两个教学层次,选取两本主流数据库课程教材中引入的案例数据库加以分析各自的优点和不足。

1.1图书管理系统数据库

由南京师范大学郑阿奇教授主编的数据库课程系列教材被列为普通高等学校国家级规划教材,在职业院校和应用型本科院校的数据库课程教学中广泛使用。该教材以图书管理系统数据库作为教学案例[3]。

1.1.1图书管理系统数据库逻辑结构

图书管理系统数据库的逻辑结构[3]如下:

1)管理员表:Administrator(角色名,密码,备注)

2)读者表:TReader(借书证号,密码,姓名,性别,出生时间,专业,借书量,照片,备注,联系方式)

3)图书表:TBook(ISBN,书名,作译者,出版社,出版年月,价格,复本量,库存量,分类号,内容提要,封面照片)

4)借阅表:TLend(借书证号,ISBN,图书ID,借书时间,应还时间)

5)还书表:HLend(编号,借书证号,ISBN,图书ID,借书时间,还书时间)

6)借出表:TBLend(图书ID,ISBN,是否借出)

1.1.2图书管理系统数据库设计分析

优点:图书管理系统数据库设计较为完整,学习者不难结合其他程序设计语言(如C#、JSP、ASP.NET等)构造出一个实用的数据库应用系统作为课程设计。另外,该案例数据库的属性较为丰富,可涵盖SQL语言的主要数据类型。

不足:第一,可能是为了方便数据查询,图书管理系统数据库设计上存在不规范问题:部分表没有达到3NF的规范化要求。例如在借阅表TLend中,存在非主属性ISBN对码(借书证号, 图书ID , 借书时间)的部分函数依赖[4]。还书表HLend也存在类似问题。改进的方法是从借阅表TLend和还书表HLend中去除属性ISBN,同时在TLend中加入“编号”属性作为该表的主码。第二,图书管理系统数据库的设计存在冗余问题,部分属性属于冗余属性,可以从相关表中去除[4]。例如图书表TBook中每本书的“复本量”和“库存量”可通过对借出表TBLend中相关记录进行聚集函数查询(使用函数count)得到,所以这两个属性应该从图书表Tbook中去除(如果存在,为了维护数据完整性系统将付出很大的性能代价)。第三,和企业实际工程项目相比,图书管理系统数据库略显简单。

1.2学生选课数据库

由中国人民大学王珊和萨师煊两位教授编著的《数据库系统概论》一书引入的案例数据库——学生选课数据库在国内多数本科院校授课时广泛采用[5]。《数据库系统概论》也是国内第一部介绍数据库的教材,一直被国内大多数本科院校作为课程教材和主要教学参考书。

1.2.1学生选课数据库逻辑结构

学生选课数据库的逻辑结构[5]如下:

1) 学生表:Student(Sno,Sname,Ssex,Sage,Sdept),其中属性Sno表示学号,Sname表示学生姓名,Ssex表示学生性别,Sage表示学生年龄,Sdept表示学生所在系。

2)课程表:课程表Course(Cno,Cname,Cpno,Ccredit),其中属性Cno表示课程号,Cname表示课程名,Cpno表示先修课程的课程号,Ccredit表示课程学分。

3)选课表:选课表SC(Sno,Cno,Grade),其中属性Grade表示选课成绩。

1.2.2学生选课数据库设计分析

优点:学生选课数据库由学生表Student,课程表Course和选课表SC构成。该案例数据库设计相当简洁且符合关系规范化要求,因而在国内数据库课程教学中广泛采用。

不足:第一,由于组成数据库的表的数量较少,属性定义不能完全涵盖SQL语言的主要数据类型(如在定义学生选课数据库的表时无法使用日期时间类型)。第二,学生表Student的属性Sage是派生属性,应改为Sbirthdate(学生出生日期)较为合理,且可在定义时使用日期时间类型。第三,相比企业实际工程项目,学生选课数据库过于简单。教师在讲授复杂查询技术、存储过程、触发器等内容时,设计例题会比较勉强,无法设计出实用性强的例题(有时仅仅为了说明相关理论或技术而举例,无法让学生理解该理论或技术的实际价值)。

2案例数据库的优化设计

2.1设计良好的案例数据库应满足的条件

基于前面对主流数据库课程教材中引入的案例数据库的分析,我们认为一个设计合理、实用、新颖,具有较高教学价值的案例数据库应该满足:

1) 案例数据库应来源于真实工程项目或对实际项目进行简化,具有一定的实用性、启发性和创新性,能完整贯穿数据库课程主要知识点,对学生进行数据库知识学习和技能训练起到良好的辅助效果[6]。

2) 案例数据库的所有数据表应符合关系规范化要求,所有数据表均应达到3NF甚至BCNF。

3) 案例数据库的数据表数量应当在5~6个最为适宜。实践教学表明,如果案例数据库中表的数量太多,对于初学者而言,在学习多表连接查询或嵌套查询时会有一定的干扰;表的数量太少,在讲授存储过程、触发器等内容时,教师不易设计例题。

4) 构成案例数据库的数据表中应包含较多的属性,这样才能涵盖SQL语言的主要数据类型,以便让学生接触和理解各种数据类型的使用方法。毕竟对于任何程序设计语言而言,数据类型始终是最基础、最重要的教学内容之一。

5) 案例数据库的记录数量要达到一定规模,以便能更好地满足教学和实验的需求。

2.2论坛数据库“simpleforumdb”

论坛模块是各类网站中必备的模块之一[7],也是学习各种程序设计语言最理想的入门项目。我们在对“嘉兴人网”、“天涯”等典型论坛结构分析的基础上,设计出论坛数据库“simple-forumdb”项目作为课程的案例数据库。该案例数据库具有很好的工程项目背景且符合前文提到的设计良好的案例数据库应满足的条件,可用于实际项目(或对其稍加改造)[8]。论坛数据库“simpleforumdb”的逻辑结构如下:

1) 用户等级表:rank(rankno, rankname, minimumintegral),其中属性rankno表示等级编号,属性rankname表示等级名称,属性minimumintegral表示达到某级别的最低积分。

2) 用户表:user(username,emailaddress, password, register-date, integral, userrank, status, lastactivetime, lastenunciabletime), 其中属性username表示用户名,属性emailaddress表示电子邮箱地址,属性password表示密码,属性registerdate表示注册日期,属性integral表示用户积分,属性userrank表示用户等级,属性status表示状态(是否在线),属性lastactivetime表示上次活跃时间,属性lastenunciabletime表示上次发表时间。

3) 版块表:column(columnid, columnname, moderator,columndescription, parentcolumnid),其中属性columnid表示版块编号,属性columnname表示版块名称,属性moderator表示版主的用户名,属性columndescription表示版块说明,属性parent-columnid表示父版块编号。

4) 主帖表:mainpost(mainpostid, belongedcolumnid, poster, ti-tle, content, posttime, clickrate),属性mainpostid表示主帖编号, 属性belongedcolumnid表示主帖所属版块编号,属性poster表示发表主帖用户的用户名,属性title表示主帖标题,属性content表示主帖内容,属性posttime表示发帖时间,属性clickrate表示点击率。

5) 跟帖表:replypost(replypostid, belongedmainpostid, reply-er, replycontent, replytime),属性replypostid表示跟帖编号,属性belongedmainpostid表示跟帖所回复的主帖编号,属性replyer表示回复用户的用户名,属性replycontent表示回复内容,属性re-plytime表示回复时间。

3结束语

通过对现有的国内主流数据库教材中引入的案例数据库进行比较分析,我们设计了具有较强工程背景和较高教学价值的案例数据库——论坛数据库“simpleforumdb”,以取代传统的图书管理系统数据库和学生选课数据库,用于数据库课程教学和实验教学。实践表明,教学案例数据库的优化设计对于改善教学效果,提高学生实践能力,培养学生的创新精神起到重要作用,最大限度地满足了教师教学和学生实验的需求。

摘要:针对目前数据库课程中教学案例选取存在的问题,分析和研究了国内主流数据库课程教材中所设计的案例数据库,提出以论坛数据库“simpleforumdb”作为课程的教学和实验案例数据库,并给出该案例数据库的详细设计。

关键词:数据库,课程教学,案例数据库设计

参考文献

[1]朱敏.SQL Server课程教学方法探究[J].新课程·中旬,2014,(1):96-97.

[2]教育部高等学校非计算机专业计算机基础课程教学指导分委员会.关于进一步加强高校计算机基础教学的基点意见[M].北京:高等教育出版社,2004.

[3]郑阿奇.SQL Server 2008应用实践教程[M].北京:电子工业出版社,2010:14-21.

[4]西尔伯沙茨(Silberschatz A.)等著,数据库系统概论(原书第6版)[M].杨冬青,等,译.北京:机械工业出版社,2012:184-189.

[5]萨师煊,王珊.数据库系统概论[M].4版.北京:高等教育出版社,2006:28-33.

[6]张欢枝.案例教学法在SQL Server数据库教学中的运用研究[J].计算机光盘软件与应用,2013,2:270.

[7]付逍遥.基于SSH架构的论坛系统设计与实现[J].福建电脑,2015,7:107.

常见的数据库对象数据库教程 篇5

3.3.1 表(Table )

数据库中的表与我们日常生活中使用的表格类似,它也是由行(Row) 和列(Column)组成的,图3-1 中黑底白字的部分称为行,图3-2 中黑底白字的部分称为列。列由同类的信息组成,每列又称为一个字段,每列的标题称为字段名。行包括了若干列信息项。一行数据称为一个或一条记录,它表达有一定意义的信息组合。一个数据库表由一条或多条记录组成,没有记录的表称为空表。每个表中通常都有一个主关键字,用于惟一地确定一条记录,如图3-1 中的emp_id 列。图3-1 中的第一条记录,即第一行数据所表达的信息为:编号为10010001 的员工叫张三,性别男,出生于1968 年2 月14 日,工作级别为1 ,工

作部门编号为1001, 受雇日期是 年8 月2 日,月工资是8000 元。

3.3.2 索引(Index)

索引是根据指定的数据库表列建立起来的顺序。它提供了快速访问数据的途径,并且可监督表的数据,使其索引所指向的列中的数据不重复。如图3-3 所示。

3.3.3 视图(View)

视图看上去同表似乎一模一样,具有一组命名的字段和数据项,但它其实是一个虚拟的表,在数据库中并不实际存。在视图是由查询数据库表产生的,它限制了用户能看到和修改的数据。由此可见,视图可以用来控制用户对数据的访问,并能简化数据的显示,即通过视图只显示那些需要的数据信息,

例如:

从图3-2 中抽取字段员工编号emp_id、员工姓名e_name、员工部门编号dept_id、员

工工资e_wage 组成一个员工工资信息表。如图3-4 所示。

从图3-2 中抽取数据组成工作级别(job_level)为2 的员工信息表。如图3-5 所示。

3.3.4 图表(Diagram)

在SQL Server 中图表其实就是数据库表之间的关系示意图。利用它可以编辑表与表之间的关系。如图3-6 所示。

3.3.5 缺省值(Default)

缺省值是当在表中创建列或插入数据时,对没有指定其具体值的列或列数据项赋予事先设定好的值。如图3-7 所示。

3.3.6 规则(Rule)

规则是对数据库表中数据信息的限制。它限定的是表的列。如图3-8 所示。

3.3.7 触发器(Trigger)

触发器是一个用户定义的SQL 事务命令的集合。当对一个表进行插入、更改、删除时,这组命令就会自动执行。如图3-9 所示。

3.3.8 存储过程(Stored Procedure)

存储过程是为完成特定的功能而汇集在一起的一组SQL 程序语句,经编译后存储在数据库中的SQL 程序。如图3-10 所示。

3.3.9 用户(User)

所谓用户就是有权限访问数据库的人。

数据库 篇6

【关键词】 数据库 逻辑设计 物理设计 性能优化

一、引言

SQL Server数据库的性能受到多种因素的制约,比如数据库的结构、数据库的载体操作系统、硬件水平等等。在上述诸多因素中,有些情况必须要改变客观的情况才能够优化数据库性能,这些因素基本包括数据库本身因素之外的其他因素。而有些因素仅与数据库系统本身有关。本文对数据库结构对数据库性能的影响进行了研究,并针对数据库设计的改进来对数据库的性能进行优化。数据库的设计总是和实际应用紧密相结合的是面向客户的基本需求的,因而数据库的设计应该从客户的需求来出发进行设计。数据库的设计首先是为了满足客户的需求并且具备较好的性能,因而可以看到优化数据库的性能是数据库设计最为基本的要求之一,由于数据库的优化与数据库的设计二者紧密相关,而数据库的设计一般包括数据库的逻辑设计、数据库的物理设计以及事物日志设计等。

二、结构设计要点

要通过对数据库的设计来实现对数据库的优化,首要的是熟悉数据库的基本结构,这是通过结构设计进行数据库优化的基础。数据库一般包括一个主数据文件以及一个多人事务日志文件,此外在有些数据库中还有辅助数据文件等。一般讲主数据文件看做是整个数据库的起点。该主数据文件会指向数据库中其他的文件。主数据文件中一般会包含数据库文件的启动相关信息,主要用于存储数据,主数据文件是每个数据库所必须的。事务日志文件一般包括恢复整个数据库所需要的日志文件信息。作为数据库来说日志文件也是必须具备的,数据库可以通过数据库的日志文件来恢复数据库。辅助数据文件是相对于主数据文件来讲的,主数据文件主要是指除外主数据文件以外的全部的数据文件。因而如果主数据文件包含所有的数据文件时就不需要辅助数据文件,而实际可能的情况是由于数据库比较大而会存在多个的辅助数据文件。系统表中的model数据库会在数据库创建的过程中被转移到数据库当中。在数据库中最小的存储单位为页,其中每页为8kb的磁盘空间。在数据库中行不能够跨页,扩展是数据库的又一基本单元,可以将空间分配相应的表或者是索引。事物的日志文件含有可以恢复数据库的重要的信息,这在数据库发生故障或者是崩溃的时候尤为重要。了解数据库结构设计要点对于在数据库设计的过程中对数据库进行优化以及规范具有十分重要的意义。可以通过对数据库文件以及事物日志映射的方式来进行管理,就能够实现优化数据库的目标并能够具有较好的系统容错性。

三、数据库逻辑设计

数据库的逻辑设计主要是根据实际的业务需求和所需的数据建立数据模型。主要是对表与表之间的关系进行规范和设计,这是数据库优化的重要核心问题。从数据库结构设计对系统性能优化的整个影响机制来看,数据库的逻辑设计是对整个数据库进行性能优化的基础环节也是最为重要的环节。而数据库逻辑设计优化的过程也就是使用规范、简洁的关系来代替原来关系的一个过程。如果一个关系所有的字段都已经不再可分,那么这种关系就是规范化的逻辑关系。该关系满足数据库逻辑设计的第一范式,在此基础上进一步将属性和关键字之间进行消除可以得到第二范式,进一步消除属性与关键字之间的传递函数关系就可进一步得到第三范式,这种关系规范化的过程就是对关系进行分解的过程,因而在数据库的逻辑设计过程中必须要满足第三范式。实际上逻辑设计就是将数据分布到各个表的技术,使用规范化的设计技术能够有效的消除数据的冗余,将数据之间的层次关系理清楚,有效的保证数据库的完整,使得数据库的稳定性较好能够较为智能的解决删除时的异常。数据插入异常,也就是相关数据信息未插入到数据库当中以及更新问题等。

数据库的规范化在一定程度上降低了冗余的数据,数据库冗余数据的减少使得其在数据库中数据量有效的减少了,进而能够减少存储数据的页,这对系统查询性能具有一定程度的提升,有效的避免了数据库中多个位置有一个数据的情况。能够显著提升应用程序的效率并且能够减少数据库使用过程中所出现的错误。

但是规范化的设计有时候也会对系统的性能产生一定程度的影响,规范化实际上是将二维表分解为最小组分的表,所以对于一些查询运算可能就需要完成较为复杂的联结运算,复杂的联结运算会导致计算机运行的时间、空间以及效率的损失,且使得客户端的编程难度也极大的增加会导致较为明显的性能的下降。所以必须要对其规范化进行平衡,使用反规范化来相应的提高系统查询的速度。

四、物理设计

数据库物理设计的过程是将逻辑设计映射到物理设备上的一个过程,使用相应的软件功能可以较为方面的实现对数据库进行物理访问,数据库使用I/O接口函数来实现对数据的读写,其中磁盘设备往往会成为影响数据库性能的主要方面,在这种情况下用户可以将数据最大限度的分解到多个磁盘上,在这种情况下可以采取并行访问的方案来提高文件访问的速度,可以将每个物理磁盘创建为一个文件并设置相应的文件分组,在这过程中可以使用RAID技术来实现对数据库性能的优化。该设备允许对多个磁盘进行条带化,可以便于使用更多的磁盘进行同时进行数据的读写,然后进行查询,可以有效的提高数据查询的效率。

五、结语

通过对数据设计对数据库性能的影响分析可以看到数据的逻辑设计过程中使用规范化的设计能够在一定程度上减少数据冗余进而提高数据库系统的性能,但是逻辑规范化的设计也会存在着一定的问题可以通过反规范化设计进行均衡。物理设计过程中对数据库性能影响较大的因素为物理磁盘设备,可以使用RAID技术来对物理结构进行优化设计从而允许对多个磁盘的读写提高数据库查询的效率。

参 考 文 献

[1] 任巍. 铁路巡检作业信息实时管理系统的数据库设计[J]. 信息与电脑(理论版). 2015(02)

[2] 谭峤. SQL Server数据库性能优化研究[J]. 硅谷. 2014(08)

数据库 篇7

关系数据库管理系统 (Relational Database Management System, RDBMS) 是当前信息系统开发中广为采用的数据管理技术。然而, 功能的完备性使其占据大量的系统资源, 导致性能及其低下, 且价格昂贵。

面向对象数据库系统 (Object-Oriented Database Systems, OODBS) 是面向对象的程序设计技术与数据库技术相结合的产物。其主要特点是具有面向对象技术的封装性和继承性, 提高了软件的可重用性。OODBS强调高级程序设计语言与数据库的无缝连接, 但技术还不成熟, OODBS开发的有关原理才刚开始具有雏形, 在可靠性、成本等方面还难以令人满意, 现在的市场份额非常小。

可扩展标记语言XML是一种简单的数据存储语言。XML文档不像RDBMS提供了强有力的数据存储和分析能力, 它仅仅是展示数据。XML文档最大的优点就是简单、占用的系统资源少、能与多数应用系统开发工具无缝连接。基于关系数据库理论的面向对象数据库系统 (Object-Oriented Database System Based on Relational Database Theory, ROODBS) 正是使用XML文档对数据进行外部存储, 几乎不占用任何系统资源, 并以关系数据库理论为基础, 提出高效稳定的OODBS的开发方法, 大大提高了开发效率和系统的稳定性, 并且可以节省数据库方面的费用开销, 降低开发成本。

1 系统架构定义

Microsoft Corporation的.NET Framework和Sun 公司的J2EE是现在比较主流的开发平台。对于.NET Framework系列产品, ROODBS由Dataset结合XML文档构成。Dataset是关系数据在内存中面向对象表述, 而XML文档是Dataset的外部存储结构, 两者相结合使用, 可以完全取代RDBMS;而对于J2EE平台, ROODBS则由ResultSet结合XML文档构成。

如图1所示, ROODBS的系统架构与RDBMS的系统架构除了数据服务层外, 完全相同。ROODBS的数据服务层采用的是XML文档, 而RDBMS采用的是数据库。可见ROODBS继承了RDBMS的基本功能, 能够满足绝大多数应用系统的要求, 不会给系统开发增加负担。

采用ROODBS的优势在于:

(1) ROODBS继承了关系数据库系统的基本功能, 能够满足绝大多数应用系统的要求, 不会给系统开发增加负担。对于那些关系数据库系统具有的, 极少使用的特殊功能, 可以在应用系统中编程实现。

(2) 各种RDBMS与其宿主语言之间数据类型的不一致性, 是RDBMS普遍存在的问题, 各种数据类型之间的转换经常引发系统异常或数据丢失。采用ROODBS能够确保语言、数据类型与应用系统开发工具完全一致 (如图2所示) 。

(3) ROODBS整合于应用系统中, 与RDBMS相比较, 不占用任何系统资源 (包括空间资源和时间资源) 。

(4) 应用系统和RDBMS是两个相互独立的系统, 任何一方出现问题都会导致系统瘫痪, 而系统瘫痪的主要原因都是RDBMS出现问题所致。由于ROODBS整合于应用系统中, 出现问题的概率仅仅相当于前者的二分之一 (如图3-4所示) 。

图2-4都是.NET Framework平台下的代码展示。

通过图2中的代码可以看出采用ROODBS能够确保语言、数据类型与应用系统开发工具完全一致。图3与图4对比可以看出:在对数据操作过程中, ROODBS与应用系统完全同步, 而RDBMS在同步Dataset的同时, 还要同步数据库, 不但效率仅为ROODBS的二分之一, 而且出现问题的概率会增加二倍, 每一步出现问题都会导致数据不一致, 甚至应用系统崩溃。ROODBS完全是在内存中对数据进行操作, 需要编写时间控件在固定时间把内存中的数据备份到硬盘 (XML文档) , 比如定时午夜自动写入。

2 应用实例

本文采用ROODBS成功的开发了普通高校学生信息管理系统 (Student Management Information System, SMIS) , 使用的是Microsoft Corporation的.NET Framework开发平台。ROODBS由Dataset结合XML文档构成。Dataset是关系数据在内存中面向对象表述, 而XML文档是Dataset的外部存储结构, 两者相结合使用, 完全取代了RDBMS。

SMIS是一个集学籍管理、成绩管理以及其它教务相关事务处理为一体的综合信息系统。对于一个普通高校来说, 学生的信息管理到毕业两年便可以导出, 也就是共存储6年的学生信息。以每年新生平均大约为6000人计算, SMIS需要管理的学籍信息每年就是6000条, 6年就是:

6 * 6000条=36000条

以每人在校期间平均要修满15门课程计算, 那么6年的成绩信息量:

15门课 * (1+2+3+4+4+4) 年*6000人=1620000条

数据冗余在关系数据库中是不可避免的, 而学籍信息与成绩信息又包含了大量的分类控制信息, 例如院系、专业等。如果采用RDBMS进行数据管理, 每个冗余字段通常都要固定为50位 Unicode的长度, 经计算每条记录的空间占用量将达到1k, 这样SMIS的主要数据占用的存储空间将达到:

(36000+1620000) 条 * 1k=1656000k≈1.58G

算上其他的基础信息SMIS的数据量将达到2G, 这仅仅是外存占用。在使用过程中关系数据库会占用2G多的内存, 还要把数据库中的数据存到Dataset中, 同样需要2G的内存, 共4G的内存耗费对服务器的负担太大, 这样的系统在Win32下也很难实现。而采用ROODBS技术进行系统开发, 数据库中数据为实际存储的String型数据, 无需固定大小 (如图2所示) , 每条记录的大小是其存储的字符串的实际大小 (如图5所示) , 约为RDBMS中的1/5。所以使用 ROODBS技术开发SMIS系统, 主要数据占用的存储空间为:

(1/5) * 1.58G ≈ 0.32G

同时ROODBS是在内存中操作, 数据库不会占用服务器的内存资源, 仅仅Dataset会占用一些内存资源, 约0.32G。

在实际应用中, SMIS分别使用ROODBS技术和RDBMS技术向数据库中添加1656000条相同数据 (选择的是实际应用中比较有代表性的数据) 。服务器配置是:2个4核Intel (R) Xeon (R) CPU, 4G内存, RDBMS为SQL Server 2008 (如表1所示) 。

可以看出ROODBS在各个方面都优越于RDBMS, 并且更加稳定;ROODBS无论是开发成本, 开发效率, 还是用户体验ROODBS都有它无与伦比的优越性。ROODBS的外部存储数据还可以压缩, 更加节省空间, 并且无论是.NET Framework还是J2EE平台都提供了压缩、解压缩接口, 不会带来额外负担。

3 结束语

通过以上的阐述和实验可以看出:ROODBS继承了RDBMS的基本功能, 能够满足绝大多数应用系统的要求;同时, 能够实现与高级程序设计语言的无缝连接, 大大提高了开发效率和应用程序的稳定性, ROODBS也节省了RDBMS的昂贵费用。ROODBS在各个方面都有质的飞跃。

由于Win32系统只支持4G的最大单个文件, 这就要求用于存储数据的XML文档最大不能超过4G, 但这对于中小型信息管理系统来说已经足够了。从目前的软硬件发展趋势来看, 64位系统必将取代32位系统。在64位系统下ROODBS将摆脱文件4G大小的限制, 也将会有更大的发挥空间。

参考文献

[1]董逸生.CIMS中的数据库技术[M].北京:机械工业出版社, 1997.

[2]Malcolm Atkinson, Fran ois Bancilhon, David DeWitt, et al.TheObject-Oriented Database System Manifesto[C]//Proceedings of theFirst International Conference on Deductive and Object-OrientedDatabases, 1989.

[3]董传良.面向对象数据库中的等价模式演化策略[J].计算机工程, 2000.

[4]黄剑利.OODB的概念、发展与现状[J].计算机工程与应用, 1997.

[5]Extensible Markup Language (XML) 1.0.W3C Recommendation[EB/OL].http://www.w3.org/TR/1998/REC-xml-19980210, 1998.

[6]王学成, 张长海.基于XML信息系统开发平台的设计与实现[J].吉林大学学报:信息科学版, 2005.

[7]李英梅.XML数据库及相关问题研究[J].哈尔滨师范大学自然科学学报, 2002.

[8]张素智.XML数据库及其应用研究[J].计算机工程与应用, 2002.

[9]田恒奎, 高景昌.XML实现无数据库留言簿[J].吉林大学学报:信息科学版, 2004, 22 (1) .

数据库 篇8

尽管因特网为我们带来了良好的发展机遇,但它也使我们迎来了不小的挑战。例如,使万维网中Web服务、Web站点导航的设计、Web站点设计、电子商务、Web服务设计等主要工作变得更加复杂。如何提高用户的访问频度、访问兴趣与访问时间等是需要关注的重点,因此,利用基于Web数据库的数据库挖掘技术进行信息的挖掘就显得尤为重要[1]。

1. 以Web数据库为基础的数据库挖掘技术的概念

1.1 基于Web数据库的技术

使用数据库和Web技术两者结合进行动态Web数据库应用的开发已经成为了网络时代中Web技术的研究热点。Web数据库的系统是指利用Web技术和数据库之间进行连接,并通过此种方式来产生以数据库为基础的动态页面,进而为客户在不同的地域内进行操作提供方便,让远程监控得以实现。不难发现,Web的数据库技术是数据库技术和网络计算机技术的综合产品,在数据库系统中管理与存放的大量信息都可以为用户提供访问,它能够实现许多不同数据库的服务器中各类信息资源的整合与组织[2]。

1.2 数据库挖掘的概念

数据库的挖掘就是指将可理解的、有效的和有潜在用处的模式信息资源从大量数据中分析提炼的过程。需要注意的是,并非所有数据库的信息发现都能够被称作数据挖掘。例如,通过数据库的管理系统进行个别记录查找的工作,只能划归与信息的检索领域。随着理论数学的不断进步,数据库的挖掘技术也得到了相应的提高。数据库挖掘技术领域在对人工智能、模式识别和统计学技术等基本理论与搜索建模的技术进行充分利用的同时,也将进化计算、可视化、最优化和信息论等学科内的观点进行了总结性归纳和推理,并从中探索出数据间所存在的潜在关系,进而为信息传递的促进提供了基础。

2. 以Web数据库为基础的数据库的挖掘方法

2.1 覆盖正例的排斥反例法

覆盖正例的排斥反例法是指按照对所有反例进行排斥或对所有正例进行覆盖的思路进行规则的寻找。在使用此方法时,首先要随意选择正例集合当中的一个种子,之后依次与反例集合中的种子进行比较,最后把能够和字段取值选择构成子相容的种子去除,将和其相反的保留下来并根据此类方法对所有正例的种子进行循环,最终才能够获得正例的规则。

2.2 粗略集合方法

尽管粗略集合的方法所得到的信息并不精确,但这种方法依然有对输入信息运算与表达方法简单、便于进行操作、无需额外的信息资源等优势。但需要注意的是,对于其处理对象而言,通常都是近似二维关系的资源信息[3]。

另外,尽管不断健全和发展的数据库的管理系统为粗略集合方法的挖掘数据库技术创造了前提条件,但由于其基础是数学中的集合论,所以对连续属性的信息很难直接进行处理,而在实际数据库内连续属性的信息表是很常见的,因此,要将粗略集合方法应用与实际的操作当中还是存在一定困难的。

2.3 模糊集合方法

此类方法指的是使用模糊集合的理论对实际中产生的问题进行模糊的评判、分析、识别和决策。通常而言,系统复杂的程度越大,模糊性就会越高,因此,许多模糊集合的理论都会使用隶属度对模糊事物的属性进行刻画。

2.4 统计的分析方法

一般数据库中的字段项间都存在相关关系与函数关系,因此当在对其进行分析时就能够使用统计学当中的分析方法,对数据库内的资源信息利用有关的统计学原理进行分析。除此之外,在进行资源信息分析时还可使用回归分析、差异分析、常用统计和相关分析等四种方式。

3. 以Web数据库为基础的数据库的挖掘技术

3.1 技术的分类

3.1.1 Web的结构挖掘

此类技术主要是指从万维网的链接关系与组织结构中对知识进行推导。鉴于文档间相互连接的万维网可以供给除文档内容外的其他有价值的信息,因此,利用此类信息可以将页面重新进行排序,进而寻找到重要页面。另外,在多层次的Web数据库系统中也可以利用页面链接的结构。

3.1.2 Web的使用模式挖掘

对于此类挖掘技术而言,其主要目的是将Web访问记录中用户感兴趣的模式抽取出来。在万维网中,由于每台服务器都会对用户的交互与访问信息记录并保留访问日志,所以通过对此类数据的分析与挖掘可以有助于理解用户的行为,从而为提供用户个性化服务和站点结构的改进提供依据。

3.1.3 Web的内容挖掘

Web的内容挖掘主要是指通过文档的描述或其内容的描述而对知识进行抽取的过程。例如以概念索引为基础的资源发现和以代理为基础的技术都可以归纳与此类方法当中。

3.2 种类的分类

以Web数据库为基础的数据库的挖掘可以依照用户对Web数据的兴趣程度差异分为:网络用法的挖掘、网络结构的挖掘和网络内容的挖掘。

在上述三种分类中,网络用法的挖掘的对象与后两者不同,其面对的主要是用户与网路交互过程内所包括的如代理服务器的日志记录、用户简介、用户交易或对话信息、注册信息、网络服务器的访问记录、用户的提问方式、浏览器的日志记录等一系列可以进行抽取的数据。

通过此种分类进行挖掘,对于了解用户在网络行为中的数据具有重要且现实的意义。

3.3 挖掘的步骤

通常情况下,以Web数据库为基础的数据库的挖掘可以分为资源查找、信息的预处理与选择、模式的发现和模式的分析等四个步骤。

3.3.1 资源查找

在此步骤中,主要任务是以目标的Web文档为基础并从中取得数据。需要注意的是,信息的资源有时并不仅仅局限于在线文档,而且还包括电子文档、电子邮件、网站日志的数据、新闻组或以Web为基础的交易数据库中的内容[4]。

3.3.2 信息的预处理与选择

其主要任务是讲已经获得了的资源中所包含的无用信息进行剔除,同时同抽取出的信息进行大致整理和归纳。例如去除多余的格式标记、自动识别的字段或者段落、广告链接等杂质,之后再把数据进行逻辑形式的归整与组织。

3.3.3 模式的发现

此步骤中可以进行自动的模式发现,其范围可以是在多站点或同一站点内部进行。

3.3.4 模式的分析

模式的分析步骤主要是为了解释、验证模式的发现步骤中所产生的模式。其工作方式既可以由人员间的交互完成,也可以由机器自动完成。

4. 以Web数据库为基础的数据库的挖掘技术应用分析

4.1 应用于网络教育领域

随着新课标概念的产生,教育也正逐步向网络化方向发展。它不仅有利于学校对学生的具体要求进行深入了解,而且还提供了更为便利的学习方式。与传统的教学模式相比,网络教学同样需要根据不同的受教育者特点,制定与之相适应的教学方案。所以,充分利用Web数据库和数据库的挖掘技术,从活动和Web文档中对潜在有用或学生可能感兴趣的模式与隐藏信息进行选取,才能更好的达到为学生提供良好的网络教育服务的目的。

4.2 应用于网站设计领域

在对网站进行设计时,使用数据库的挖掘技术来挖掘网站的内容,特别是文本的内容,可以更好的进行网站信息的组织与规划。通过挖掘网络用户访问的记录,可以更好的了解用户对于兴趣的信息,从而可以使网站有效的开展个人的信息定制、网站的信息推广等活动。

4.3 应用于电子商务领域

在电子商务领域中,可以充分使用数据库的挖掘技术挖掘企业客户所访问和关注的信息,之后可以按照所收集到的信息对客户分类,并对分类中客户的特征与兴趣进行分析,从而让企业能够更深入的了解客户的资料,以此做到对客户提供适合其特点的服务。另外,利用此类技术不仅可以保证客户在网络中停留的时间,而且还能够为企业发现潜在的客户资源,进而为企业利润空间的提升提供保障。

4.4 应用于搜索引擎领域

对于搜索引擎领域而言,以Web数据库为基础的数据库的挖掘技术是当前发展中的关键因素。由于大多数人常常会通过使用搜索相关的网页等方法进行信息获取,因此对搜索引擎领域的挖掘可以有效的实现对网页的划分与归类,进而实现分类网络信息的检索和浏览。另外,运用Web挖掘技术中关键词改进加权算法等方法,也能够达到改进搜索效果、提高网络的消息准确度。

5. 结语

作为当前环境中最大规模的信息库,Web数据库为数据挖掘的技术的发展提供了必要的前提和大环境中的条件。以Web数据库为基础的数据库的挖掘技术不仅提高了信息检索时的准确性,而且对网络教育、网站设计、电子商务以及搜索引擎等领域进行个性化服务的发展方向和未来趋势具有十分重要的指导意义和现实意义。

参考文献

[1]Jiawei Han,,Micheline Kamber.DataMining:Concept and Techniques.2009.

[2]鲁俊,孙永鸿.基于电子商务应用的Web数据挖掘技术研究[J].电脑知识与技术.2009.

[3]居晓琴,周学全.Web数据挖掘技术探索与应用[J].山东纺织经济.2009.

浅谈数据库管理系统的数据库设计 篇9

1 数据库管理系统相关介绍

现阶段, 存在着一种数据库管理系统, 用户可以通过数据管理系统访问数据、获取数据应用数据等, 并且数据库管理系统也具有一定的开放性, 它可支持多个应用程序或者多位用户通过不同的途径同时实现数据库的访问, 而相关维护人员也通过这个系统实现数据系统的维护, 也可通过多个途径修改数据库, 确保数据库的正常应用。换句话说, 数据库管理系统可以有效实现数据库的建立、应用与维护, 为数据的应用提供了极大的便利条件。

2 数据库管理系统的数据库设计

数据库是整个数据库管理系统的核心部分, 通常来讲, 数据库的设计与研发阶段, 相关设计研究人员会将更多的精力放在系统的功能实现上, 往往忽略了测试数据对整个数据库设计的影响, 有些测试数据较小, 无法判定系统运行质量, 而系统实际运行时, 往往涌入大量数据, 很可能导致系统运行质量下降, 为了维持系统的正常运行, 又投入大量的人力资源、物力资源修复系统, 改良系统, 故而, 数据库管理系统的数据库设计阶段非常重要。数据库设计需要掌握一些设计要点, 首先要选择好合适的数据库服务器, 其次要按照相关规范标准开展数据库设计工作。以下是对数据库管理系统的数据库设计的具体分析。

2.1 数据库服务器选择。现阶段, 占据市场主导地位的数据库主要分为SQL Server、Oracle、SYBASE、DB2 和INFORMIX五种, 不同类型的服务器类型有着不同的优劣之处, 但经过反复的分析比较发现, SQL Server属于微软公司研发的大型关系型数据库系统, 功能相对全面, 效率较高, 管理与操作比较简单、方便, 整个系统的安全及稳定也较高, 并且性能价格比最好, 节约企业资金, 降低研发成本, 是开发人员理想的选择, 能够作为中型企业或单位的数据库平台。

2.2 数据库设计原则。原则是数据库设计的根本, 更是导向, 只有遵守必要的原则, 才能减少设计的盲目性, 才能确保设计后的数据库易于应用。通常来讲, 数据库设计原则主要包括以下四点:

2.2.1 结构标准化、规范化。数据库在设计时, 必要确保结构标准规范, 一则有利于数据库清楚无效数据, 将有效数据直观呈现给用户;二则便于数据建立、调取与应用, 提高数据库的便捷性。

2.2.2 数据类型合理化。数据库中的数据类型必要保证合理化, 一则提高数据库可信度, 二则有利于提升该数据库管理系统数据库的运行性能。

2.2.3 数据表命名规范化。数据库中数据众多, 在设计时要充分考虑用户使用的便捷性, 直接获取目的数据, 要规范数据表命名。每个关系型数据库对数据表的命名都有一定要求, 在对数据表命名时利用大小写敏感的形式, 而且数据表命名长度不应过长, 这样能够使该数据库管理系统可以应用在多个不同的数据库平台。

2.2.4 数据库性能完善性。数据库性能完善性是数据库设计的重中之重。在运行环境已经固定的因素下, 数据库的性能成为影响该人事数据库管理系统运行性能的主要条件。可以利用两个步骤开展数据库设计:先是进行逻辑设计, 而后进行物理设计。逻辑设计要求消除所有的冗余字段, 可以完整地说明数据库表之间的关系。然而对于多表之间关联的查询, 去除所有冗余会损耗系统性能, 也会增大系统研发难度。因此, 找到一个平衡点成为数据库设计的关键, 在物理设计中开发人员要分析关联数据表的数据量大小与访问频率, 并对数据表中用来关联查询的关键字段留存适当的冗余, 以提升数据库的性能。

2.3 数据库设计方法分析。数据库设计大致分为概念数据模型设计、逻辑数据模型设计与物理数据结构设计等三个阶段, 逐步设计, 一方面确保数据表结构合理化, 另一方面使数据的存取操作有序进行, 有利于数据的建立与访问, 促进数据库管理系统的数据库建设。以下是对这三个设计步骤设计方法的具体分析。

2.3.1 概念数据模型设计。若要做好概念数据模型设计工作, 首先要明确概念数据模型本身作用, 其可反映出数据库管理系统最终用户对于数据储存的观点, 也代表着用户综合性的信息需求, 它用数据类的方式表达企业级的数据需求, 数据类描述了在业务环境中聚集起来的几个重要的类别数据。概念数据模型包括主要的实体和实体之间的关系, 为了切实描述概念数据模型, 可联系实体、属性及关系三方面因素, 三者在理论上构成“实体- 关系”图, 构建出概念数据模型图后, 开展下一个阶段的设计工作。

2.3.2 逻辑数据模型设计。所谓的逻辑数据模型是指数据库系统相关设计研究人员对数据存储的见解与意见, 是在概念数据模型的基础上深化数据储存。逻辑数据模型是按照业务规则决定的, 是业务对象、业务对象的数据项以及业务对象之间关系的描述。逻辑数据模型包括所有的实体与关系, 决定每个实体的属性, 指明每个实体的主键和外键。

2.3.3 物理数据模型设计。物理数据模型是对真实数据库的表达。数据库对象包括表, 视图、字段、数据类型、长度、主键、外键、索引以及是否可为空, 还有默认值。概念数据模型到物理数据模型的转换是将概念模型中的对象转换为物理模型的对象。

随着科学水平的不断提高, 创新思维的不断涌入, 使得数据库设计不断发展完善, 概念数据模型设计、逻辑数据模型设计、物理数据模型设计三个阶段的数据库设计不断细化发展, 在设计内容方面更为完善, 深化设计意义, 优化数据库, 提高了数据库管理系统使用性能, 促进数据库管理系统的发展。

结束语

综上所述, 数据库是数据库管理系统核心部分, 数据库的设计影响到数据库管理系统的正常运行, 不利于相关管理人员维护数据的同时更不利于用户的正常使用, 故而在数据库设计阶段要充分做好设计工作。笔者认为, 高水平的数据库设计需要性能良好的数据库服务器来支持, 设计过程中要切实遵循各项原则, 掌握概念数据模型、逻辑数学模型、物理数据模型三个阶段的设计方法, 切实完善数据库管理系统数据库设计, 促进数据库的发展与应用。

摘要:数据库管理系统可以有效实现数据的建立、查询与维护, 且数据库是数据库管理系统的核心部分。本文以数据库为切入点, 分析数据库管理系统的作用及数据库设计对数据库管理系统运行的重要性, 切实探讨数据库设计方法。

关键词:数据库管理系统,数据库,设计,服务器,原则,方法

参考文献

[1]孙璐.Struts2+Spring+Hibernate在企业人事管理系统中的应用[J].软件导刊, 2010.

数据库 篇10

1 Web数据库及数据库挖掘技术

1.1 Web数据库

近些年来, 随着科学技术的不断发展, 各种先进的设备一应俱全, 网络技术的发展也越来越深入人心。数据库能够存储大量的资源以及信息, 而先进的Web可以借助于数据库的技术实行远端控制, 两者之间通过交流与沟通可以产生一个随时控制的静态页面, 这样对于信息的采集和搜集都有着很大的帮助。

1.2 数据库挖掘技术

数据库挖掘技术对于互联网时代来说具有十分重要的意义, 随着经济和社会的不断发展, 人们对于信息的需求量也在不断的增大。但是信息资源的搜索并不是每一个网站都可以的, 对于信息的过滤和挖掘都是具有一定关联性的。为了数据库当中的信息都是准确无误的, 需要对信息的传递和挖掘进行认证和进一步的了解, 从而实现数据库的挖掘技术。

2 Web数据库挖掘技术分析

2.1 数据的预处理

数据的预处理是保证数据库信息来源准确的先决条件, 因为在信息数据的搜集和采集过程当中经常会有一些虚假的信息或者是不完整的信息, 对于这些信息在处理的时候一定要有着提前的预处理, 这样不仅仅能够保证信息数据库的质量, 还能够促进数据库信息的准确性。

2.2 模式识别

模式识别主要是对于相关网络的访问量以及浏览时间进行计算, 这样做的目的是希望互联网各个页面之间能够达到和谐统一的目的, 有利于Web站点数据挖掘有着一定的分析和信息采集功能, 在统计数据方便的同时满足群众的需要。

2.3 模式分析

模式分析就是利用较为科学的方式和方法对信息技术进行挖掘处理, 在对模式选择的时候通常都是选择较为合理的一种模式进行分析, 对自身所要分析的信息做对比, 最终需要确保信息的准确性。在此环节当中, 有关人员可以利用Web工具对网站进行处理, 在保证数据库灵活运行的情况下, 使得信息技术有所保障。

3 Web数据库挖掘方法及应用

3.1 挖掘方法

3.1.1 粗集方法

粗集方法对于信息的处理一般是较为简单的, 这种表示方法虽然在数据的准确度上有着一些瑕疵, 但是这种数据库分析的方法对于未来互联网时代的发展也有着一定的促进的作用。所以即使这种方式方法对于数据库有着很大的改进, 也为现如今的信息挖掘技术奠定了一定的基础, 只有熟练的进行综上操作才会对信息行业未来的发展打下坚实的基础。

3.1.2 模糊集方法

模糊集方法是当今互联网系统当中的一种确切可行的方法, 之所以称之为模糊集方法, 是因为在对事物或者是信息进行处理的过程当中经常会涉及到一些分析, 如果数据库的信息越复杂, 那么在进行数据分析的过程当中存在的难度将会越大。近些年当中已经逐渐的出现了一些较为先进的数据存储形式, 其中云端模式就是较为先进的一种。

3.1.3 统计分析方法

统计分析法对于数据库的统计和分析是十分重要的, 一般情况下对于数据库的分析会分为两种类型, 一种是与函数相关的类型, 另外一种是统计的类型。面对着不同的分析方法所表现出来的形式, 在统计当中一定要对不同的信息数据做好统计工作, 进而分清楚其中的差异关系。

3.2 应用分析

3.2.1 电子商务应用

近些年当中随着经济和社会的不断发展, 电子商务的发展已经越来越广泛了, 但是也随着而来了一些问题, 比如在电子商务当中由于客户的量比较大造成了信息的堵塞, 很多信息不能够及时的得到解决, 以及信息的安全性等, 这些都是电子商务带来的一些问题, 但是电子商务为人们带来更多的还是一些利益。通过挖掘技术可以帮助人们得到更多的信息和资源。

3.2.2 网络教育应用

在当今的21世纪, 互联网技术的发展已经扩展到了教育行业当中, 在我国目前的教育界当中, 已经充分将网络化教育融入到了学生的日常学习和生活当中, 通过互联网和Web技术可以让学生学习到更多的知识和技术, 在原有学习的基础上对教学模式进行全方位的改进, 对于学生的未来发展将会起到很好的促进作用。

4 结束语

综上所述, 笔者简单的对Web数据库近些年的发展和数据库挖掘进行了简单的介绍, 笔者认为在当今这个信息化的时代当中, 互联网的发展是社会发展的必然形式, 也是我国形式的必然趋势, 以Web数据库为基础的数据库进行挖掘能够在很大程度上提升信息的准确度和质量, 为人们的需求奠定坚实的基础。

摘要:在当今社会下, 我国的经济已经取得了很大的进步和进展, 随着经济和社会的不断发展, 我国人民群众对于信息的需求量已经越来越大, 获取信息的渠道也变得越来越多, 进入21世纪之后, 人们已经进入了信息化的时代当中。Web数据库带来的信息资源也越来越多, 下面笔者首先将会对Web数据库及数据库挖掘技术进行简单的分析, 然后对Web数据库挖掘方法及应用进行具体的论述。

关键词:Web,数据库,挖掘分析,技术

参考文献

[1]艾孜海尔江·艾合买提.基于Web数据库的数据库挖掘技术分析[J].科技致富向导, 2012, 24 (27) :217——219.

[2]刘霞, 赵鑫, 吕翠丽.数据库挖掘技术在网络安全防范中的应用[J].动画世界, 2012, 20 (06) .

[3]尚世菊, 董祥军.多数据库中的副关联规则挖掘技术及发展趋势[J].计算机工程, 2009 (05) .

[4]吕安民, 林宗坚, 李成明.数据库挖掘和知识发现的技术方法[J].测绘科学, 2010 (04) :123——130.

上一篇:跨境电商平台运营模式下一篇:当前中美贸易摩擦