结构挖掘

2024-06-16

结构挖掘(精选十篇)

结构挖掘 篇1

关键词:Web挖掘,网络站点,点击率,日志文件,应用

1 概述

随着信息技术的发展, 网络上的数据也是与日俱增, 要想从如此庞大, 杂乱的信息中找到满足用户需要的信息更加不易, 数据挖掘技术正是为了解决这样的问题而产生的技术。数据挖掘技术在网络领域的应用被定义为Web挖掘技术。对于网站上出现的大量的、各种各样的数据需要不同的Web挖掘技术更好地解决问题。Web挖掘主要关注: 搜索、将数据整合和分析数据等方面。Web挖掘的应用领域涉及电子商务、电子学习、网络检索、数据库、 人工智能、信息提取和系统改善等方面。

2 Web 挖掘的分类

Web挖掘定义为数据挖掘技术适用于从网络文档和服务器, 自动发现和提取有用信息的过程。大多数的研究人员将Web挖掘分成3个主要的研究领域 , 分别是Web内容挖掘、Web结构挖掘和Web日志挖掘。

2.1 Web 内容挖掘

Web内容挖掘是从大量的可用网络页面中发现任意网络用户感兴趣的页面的过程。Web内容挖掘更倾向于选择网络上的相关文档, 并采用分析网络文档收集到的信息, 发现相关知识的过程。侧重于将半结构化的网络数据组织成结构化的资源, 产生更有效的查询结构, 进行更有效的信息采集和提取。

2.2 Web 结构挖掘

Web结构挖掘是提取网络上有用的信息 , 发现并分析相关的超链接和链接结构的过程。通过搜索引擎排列各网站之间的相关性, 并按它们之间的关系和相似度分类。例如, 谷歌搜索引擎是基于Page Rank算法, 表明一页与之相关链接页之间具有大量的链接。基于超链接的个性化和推荐系统也是Web结构挖掘经常研究的内容。

2.3 Web 日志挖掘

Web日志挖掘从Web服务器中自动地发现用户的访问模式。每天服务器自动产生大量数据, 服务器日志文件将其收集和存储。用户信息的其他来源有对于每个页面参考值的参考页面的信息、 参考日志和用户的登记或调查数据等。

Web日志挖掘提供的信息不仅可以更好地理解服务器的需要, 还可以设计基于网络应用的网络结构。Web日志数据包括在一个特定的网络领域内用户的浏览行为的识别和来源的信息。以下着重介绍Web日志挖掘和Web结构挖掘相结合的挖掘过程。

3 Web 日志挖掘过程

3.1 数据预处理

日常生活中的数据常常是不完整的、有噪声的和不连续的。数据预处理的关键在于数据清理, 它将与数据分析和挖掘无关的数据清除。这些数据可能为下面的情况之一:

(1) 日志文件中标识为错误或失败的数据。

(2) 一些由搜索引擎自动产生的访问记录。

(3) 一些来自于同一客户端的相同URL的重复请求操作。

(4) 在一个时间段内对同一页面的请求时间过短 , 以至于无法进行记录。

(5) 对同一客户端的一系列的请求, 而其URL却是空值的。

3.2 挖掘过程

Web挖掘的关键是它本身的挖掘过程。Web挖掘技术采用从数据挖掘领域, 数据库和信息提取或发展其本身的一些技术, 如路径分析。目前, 采用已有的挖掘技术和正在研究的新技术仍旧有许多工作要做。

在网络上收集的日志数据也被非常自然地分配, 如果所有的数据在挖掘之前是一体的, 那么需要提取许多有价值的信息。然而, 从现有的服务器日志文件中收集到的数据也可能是大量的和无用的数据。而且, 从多个日志文件中挖掘到的知识需要被整合成一个更易理解的数据模型。

3.3 模式分析

模式分析的任务是过滤不感兴趣的信息, 直观地向用户解释感兴趣的模式, 给出一个直观的帮助, 有利于分析员更好地了解导航模式, 从而预测数据的趋势。

许多网络工具提供一些标准是受支持的和可以信任。这样的标准对于过滤一些确定的不重要的知识是有帮助的。

在网络站点中的网页可以被分成3类:

精彩的: 在网站中具有最高的点击率的那些网页;

一般的: 在网站中具有平均值点击率的那些网页;

不精彩的: 在网站中具有最低的点击率的那些网页。

根据用户对网页的兴趣度, 将网络用户也分成3类:

A类用户 (精彩的), B类用户 (一般的), C类用户 (不精彩的)。

3.4 知识发现

知识发现是指采用从网络站点收集的统计信息来发现知识的过程。收集来的相关信息可能是下列情况:

(1) 具有高点击率的网页是最流行的页面。

(2) 用户的导航模式可能是什么样的?

(3) 从花费在每个网络页面的时间可以得知该网页的重要性。

(4) 如果花费在特定网页上的时间可以忽略不计 , 那么说明这个网络页面并不包含重要信息。

(5) 如果网络页面并不是用户所需要的 , 那么这个页面必须被修改。

(6) 如果对于特殊页面的链接 , 日志文件入口位置重复 , 那么应该通知网络设计人员进行改进。

4 Web 结构挖掘的作用

在对网络页面进行模式分析之后, 最重要的事实是要考虑网络站点的结构。精彩的页面将移动到离首页最近的位置, 一般的页面将移动到精彩的页面之后, 那么不精彩的页面当然放到最后面。

建议网站设计中将具有高点击率的页面都移动到离首页最近的位置。也可以在特定会话的日志文件中构建可用点击数目的许多树。 创建一些表示这种数据模型的树型结构, 这样将有利于在下一个时间间隔内决定站点的拓扑结构, 便于使最精彩的页面移动到离主页面最近的位置。借助于站点结构的重建, 每个HTTP的请求将存储到服务器日志文件中, 网络用户将能在具有最大带宽、较大服务器内存空间, 进行快速访问。

5 结语

结构挖掘 篇2

【中文摘要】高校教学系统作为大学数字化教学的一个重要组成部分,运行多年已经积累了大量的数据,但并没有得到很好的挖掘和研究。相反,数据挖掘在保险、电信、金融等领域却得到了广泛的应用,取得了良好的收益,而对教育信息的挖掘及知识发现方面研究及开发却很少。为了从大量的的教学数据中获取有用的知识,更好的为高校教学、管理及科研等提供服务,本文结合高校管理系统与数据挖掘技术对教学质量评估及学生成绩分析进行了研究,对相关算法做了相应的改进,并对结果进行分析,从而获得有用的信息。本文首先介绍了论文的,国内外的研究现状,然后介绍了数据仓库及数据挖掘的基本概念,主要的数据挖掘技术,数据挖掘的体系结构及运行过程。其次就其在教学系统中的应用进行了分析,提出了教学质量评估、学生成绩分析两个分析主题,介绍了教学数据仓库的构建,给出了基于SQL Server的数据挖掘解决方案,分别运用关联规则和决策树方法进行研究,介绍了相关算法,并进行了优化,接着是数据挖掘的实现。最后对相关数据进行挖掘,对实验结果做出了初步分析,所得出的结论对高校教学工作具有一定的指导意义。

【英文摘要】Higher education management system as an important part of the university digital teaching has accumulated a lot of data for years, but has not been good for

mining and research.In contrast, data mining in insurance, telecommunications, financial and other fields has been widely used and obtained a good income, while education information mining and knowledge discovery research and development is rarely.In order to obtain useful knowledge from a large number of the teaching data, and provide better services for the university teaching, management and scientific research, this paper combines higher education management system and data mining technology and study teaching quality assessments and student performance analysis, improves interrelated algorithm,analysises the results,acquires interesting information.The article proposes the research background,the domestic and abroad research status,the concepts of data warehouse and data mining, the main data mining technologies, data mining architecture and operation process.Second,analysises data mining application in higher education management system, proposes two analysis themes including teaching quality assessments and student performance analysis, then introduces the education data warehouse, gives based on the SQL Server data mining solution, researches them with association rules and decision tree respectively, introduces and optimize the related algorithms, data mining

implementation.Finally, mines the relevant data, and makes a preliminary analysis of experimental results, the conclusions of the work have some significance on university teaching.【关键词】数据挖掘 数据仓库 关联规则 决策树

【英文关键词】Data Mining Data Warehouse Association Rules Decision Tree 【目录】数据挖掘技术及其在高校教学系统应用的研究4-57-9ABSTRACT5

目录6-7

第一章 绪论

摘要1.1 课题研究背景7

7-8

1.2 数据挖掘技术在高校教

1.4 学中应用的研究现状论文的组织结构8-99-18

1.3 研究内容及方法8第二章 数据仓库及数据挖掘理论2.1 数据仓库的概念和基本特性92.2 数据仓库开发模型9-1111-12分类13-15

2.3 数据仓库系统的设计和实施

12-13

2.5 数据挖掘的2.7 数据2.4 数据挖掘基本概念

2.6 数据挖掘的体系结构15-16挖掘的常用技术16-18施18-31

第三章 教学系统数据仓库的设计与实

3.2 高校数据仓3.1 数据仓库的应用目标库的体系结构18-1919-20实现28-31用31-42的算法32-34

3.3 数据仓库的需求分析

3.5 ETL的3.4 数据仓库三层模型的建立20-28

第四章 关联规则方法及其在教学质量评估中的应4.1 关联规则挖掘31-32

4.2 关联规则挖掘

4.4

4.3 关联规则挖掘算法的改进34-36

关联规则在教学质量评估中的应用36-42及其在学生成绩分析中的应用42-5742-44类45-4646-5757-5860-61 5.2 决策树的改进44-45

第五章 决策树方法5.1 决策树方法5.3 决策树算法的分5.4 决策树方法在学生成绩分析中的应用第六章 总结与展望57-596.2 展望58-59

6.1 论文总结

参考文献

挖掘机回转装置定位结构及分析 篇3

关键词:挖掘机;回转装置;定位结构;分析

1.回转装置的组成

液压挖掘机回转装置主要由回转支撑、回转机构和转台等三部分组成的。通过回转支承,不断将力施加给挖掘机的底座。回转装置具体由两部分组成:转柱式回转支撑和滚动轴承式回转支撑。以下我们将对这两种支撑进行简单论述:

1.1. 转柱式回转支撑

转柱式回转支撑一般情况下回转的角度比较小,其动力来源跟滚动轴承式回转支撑动力来源不一样,但是该装置使用起来比较方面,易于操作。

1.2.滚动轴承式回转支撑

滚动轴承式回转支撑目前广泛用于全回转式液压挖掘机上,它是在普通滚动轴承基础上建立和发展起来的,其性能也比较优良。同时还克服了传统回转支撑的种种弊端,该装置结构简单,维修比较方面,对于人员的使用要求也不高,所以它目前承担着大部分的工程任务。该装置还具有所受到的力矩节点数目比较少,转速也比较低,对于人员的安全大有保障。根据内部结构的不同我们又可以将其分为滚动式滚体与滚珠式滚梯两大类,更具体一点还可以分为单排式和双排式几种。随着该技术的不断进步发展,装置在很大程度上也进行了改革,但是它依然是目前比较实用的挖掘机装置回转支撑。

2.回转装置常用的定位结构图解

目前大部分的挖掘机回转装置常用的定位结构主要有以下两种:(1)回转支

承外圆定位结构,如图1所示;(2)两个销定位的结构,如图2所示。

3.回转支承一个销定位结构安装精度分析

回转支承一个销定位结构指的是在回转平台加工一个销孔用于安装定位回

转支承,同时还可以加工一个ΦD2内圆用于安装定位回转马达。回转支撑也要加工一个销孔用于安装定位,如下图3所示。我们一般在设计上要求回转平台螺纹孔分度圆中心及ΦD2内圆的中心和销孔中心一定要在同一条水平线上,这样可以保证齿轮啮合的中心间距T比较稳定。操作人员在进行装配时一定要先把回转马达固定好,然后将回转支承的销孔、螺栓孔和回转平台对齐,再进行安装销进行定位,用螺栓拧紧,这种装配的整个过程非常简单。

从图3中我们可以看出回转支承在螺栓拧紧之前可以绕销转动,转动的最大角度受到离销孔中心C最远螺栓的限制,所以该距离可以影响整个销定位的结构,在对其进行设计的时候一定要合理把握距离的尺度大小,保证回转支承一个销定位结构的稳定性,增大它们的机械强度。同时,该装置具有与其他装置不同的特点,定位的精度比较准确,结构也相对简单,同时易于安装与维护,在工程施工中使用的频率很高,值得工程施工人员采用。

结束语:

回转支承一个销定位结构的回转装置, 目前已经在大部分挖掘机上被广泛应用,在实际过程中,回转装置具有以下几方面优点:安装定位的精度与准确性比其他装置更高一筹;其次,结构简单,其内部结构比较简单,只需要一个销定位即可,该技术目前比较成熟,手段比较多样,可以满足大多说工程施工的需要;在对其进行维修与维护的时候,比其他支撑结构简单得多,可以为维修人员带来很大便利。最后,它还克服了传统的多销定位结构容易出现变形的缺陷,值得我们推广使用。

参考文献:

[1]秀文美.工程力学中的挖掘机震动装置研究[J].科技出版社,2012(9)

[2]张铁,王海丰.液压挖掘机的原理和使用[J].石油大学出版社,2012(1)

[3]张世英.挖掘机回转装置的探讨[J].机械工业出版社,2011(9)

[4]陈善华,李楠.单斗挖掘机的应用研究[J].挖掘机原理,2011(9)

作者简介

挖掘机铲斗结构及使用须知 篇4

铲斗是液压挖掘机对物料进行挖掘、装卸的工具。按工作方式的不同,铲斗可分为反铲铲斗和正铲铲斗,一般常用的是反铲铲斗。根据物料和作业工况的不同,铲斗有多种形式和规格。主要有标准铲斗和特殊作业用铲斗。

标准铲斗是按照挖掘机能发挥最大挖掘效率而配备的铲斗,适应于挖掘或装载沙、砾石和黏土(密度小于2000kg/m3)等。标准铲斗与标准动臂和标准斗杆配套使用,标准铲斗一般都配装斗齿及侧齿。配装斗齿能降低铲斗挖掘的线压力,可使铲斗易于切入物料或耙出石块。配装侧齿便于导向,但同时也增大了挖掘阻力。

2 铲斗形状和性能

(1)铲斗形状

铲斗斗宽一般不大于斗长,斗宽与物料直径之比应大于4:1,以减小偏载和便于装卸。铲斗主刀板宽度应大于铲斗根部宽度(铰轴底座部位),且口宽要大于底宽,以减少摩擦阻力,有利于装卸物料。铲斗内壁不宜设计横向凸缘及棱角,以利于物料的自由流动。

(2)铲斗性能

应保证铲斗整体结构的强度和耳板总成结构的刚度。铲斗的硬度、耐磨性要好,韧性、耐冲击性要高。铲斗工作时摩擦面积要小,切入阻力要小。铲斗的容积要大,外表面的面积要小。

3. 铲斗结构形式

目前市场上挖掘作业用铲斗主要有2种结构形式:

(1)单内切圆底板铲斗

标准铲斗、轻作业铲斗大多采用此结构形式,如图1a所示。该种铲斗的底板线形采用1个内切圆与2条相切直线组成。其优点是易于装卸黏性物料;其缺点是铲斗底部曲率半径大,铲斗张口大、强度低、容积小,物料接触面积大。

(2)双内切圆底板的铲斗

该种铲斗的底板线形采用2个内切圆与2条相切直线组成,岩石铲斗、窄幅重作业铲斗大多采用此结构形式,如图1b所示。其优点是铲斗底部曲率半径小,铲斗张口小、强度高、容积大,物料接触面积小。其缺点是黏性物料不易卸净。

4. 铲斗主要参数和零件尺寸

本文以单内切圆底板的20t级挖掘机用标准反铲铲斗为例,说明其主要结构及零件尺寸确定方法。

(1)结构参数

单内切圆底板的20t级挖掘机用标准反铲铲斗结构参数为已知条件,包括铲斗最大转角、最大仰角、摇臂连杆机构尺寸及其中心位置、铲斗结构等。其中铲斗结构如图2所示。

(2)容量参数

铲斗容量q与铲斗的平均斗宽b、挖掘半径R和挖掘装满角以及土壤松散系数ks有关,如图3所示。铲斗容量q计算公式如下:

式中:q—一标准斗容量;

R——铲斗挖掘半径,为1486mm;

b——铲斗平均宽度,为960mm;

ks——土壤松散系数,取1.25;

φ——挖掘装满角,取95°。

将以上各数值代入上式中,其计算结果即标准斗容量q为0.9m3。

H——铲斗深度b——铲斗平均宽度R——铲斗挖掘半径R1——内切圆底板圆弧半径d1——斗杆销轴座孔直径d2——斗杆缸连杆销轴座孔直径t——斗齿座中心距L1——d1与d2的垂直距离L2——d1与d2的偏心距离L3——2个销轴座孔内侧距离P1、P2——d1、d2孔的轴心点h——主刀板截面宽度h1——侧板宽度δ-主刀板板厚δ1——侧板板厚γ1——主刀板背面与坑壁之间的后角C——底后板距轴心点P1的距离α——底后板垂线夹角β——侧面板与侧板在斗深方向的倾斜角k——侧板上部与d1孔轴心点高度差

(3)斗齿连接方式

铲斗斗齿连接方式主要有2种:斗容量小于或等于0.6m3时,多采用螺栓连接;斗容量大于或等于0.6m3时,多采用卡销连接。采用卡销连接方式时,斗齿座焊接在主刀板上。使用卡销将斗齿与斗齿座连接起来,如图4所示。

(4)铲斗主要零件尺寸

主刀)板铲斗主刀板板厚按所选斗齿座的开口尺寸确定。该型铲斗主刀板板厚δ为36mm。主刀板截面宽度h应为斗齿座开口深度1.1~1.3倍,取244mm。挖掘机处于最大垂直挖深(即最大挖掘力)位置时,主刀板背面与坑壁之间的后角γ1为30.3°(满足大于20°的要求)。如图5所示。

侧板和侧面板侧板板厚δ1为主刀板板厚δ的0.6~0.8倍,取25mm。侧板一般为直形,其上端不超过主刀)板上边,且侧齿不超过前齿齿尖。为减少侧板磨损,左、右侧板前端分别与两侧斗齿座焊接在一起,侧板的下端与主刀板下端平齐。为使铲斗转至最大俯角位置时物料堆尖部分不过度压迫斗杆下扳,侧板上边线应距轴心点P1一段距离K,一般使K值等于0.5~0.8倍斗杆销轴座孔直径d1,K值取40mm。侧板中部上端也可设计成弧形,以减少挖掘阻力。侧面板与侧板在斗深方向的倾斜角β为4°~6°,在此将该倾斜角β定为5°。

底后板底后板距轴心点P1的距离C为1.6~2.0倍销轴座孔d1,取C为130mm,底后板垂线夹角α为15°。根据C和α的尺寸,确定底后板尺寸。确定底后板尺寸时,要验算铲斗缸全伸及全缩状态下,底后板是否与斗杆发生干涉。若发生干涉,要在底后板上边留有缺口。

底板铲斗底部主刀板与底后板之间为1个内切圆底板,该内切圆底板与铲斗容量密切相关,实际斗容量应符合标准斗容量q数值。经计算,铲斗深度H为749mm,内切圆底板圆弧半径R1为400mm。斗容量按照平装斗容与堆尖斗容之和计算,其堆尖斗容按照1:1斜度计算体积。

斗齿座中心距一般主刀板宽度是斗齿座宽度的2.5~4倍。该型铲斗的斗齿座中心距t为144mm。

除确定上述铲斗主要零件的具体结构以外,还要确定耳板、后加强板、内加强板、侧面板、底护板、侧护板等零件的具体结构,此后便可确定铲斗三维模型图。如图6所示。

主刀板、侧板、底板、底护板、侧面板、侧护板、底后板均采用WH60型号高强耐磨钢板,其他零件选用Q345B钢板。在铲斗零件尺寸和所用材料确定后,即可进行铲斗结构的验证及优化。

5. 铲斗结构的验证和优化

铲斗结构的合理性直接影响到挖掘机的整体工作性能。利用三维有限元分析软件进行分析验证,可以检验其设计是否满足强度要求。在此基础上进行优化,可减轻铲斗质量、降低成本、提高效率。

(1)建立铲斗三维实体模型

利用三维软件,根据已知尺寸用零件插入法精确画出铲斗的三维实体模型。建立铲斗三维实体模型时,可对铲斗进行简化,即对受力分析不产生影响的结构予以忽略。如图7a所示。

(2)受力分析和划分网格

为简化分析过程,铲斗材料参数全部采用Q345B材料的参数值。受力分析时,将铲斗的4个销孔设为固定,以铲斗的最大挖掘力作为强度分析工况(铲斗侧向力及重力对铲斗的受力影响不大,可忽略不计),并对铲斗实体模型划分网格。如图7b和图7d所示。

(3)根据分析结果优化铲斗结构

根据有限元强度分析结果,可验证铲斗强度是否满足设计要求。铲斗安全系数一般设定为2.5~3.5。若其安全系数小于2.5,需对铲斗结构进行加强;若安全系数大于3.5,则需降低部分板材厚度,以减少铲斗质量,节约制作成本。如图7c所示。

6. 铲斗使用须知

为安全、合理使用铲斗,挖掘机操作者应做到以下几点:

一是作业时须待动臂停稳后再铲土,铲斗未离开地面时不得做回转、行走等动作,以防损坏铲斗。

二是铲斗挖掘作业时,不可挖掘过深、用力过猛或使用铲斗用力撞击坚硬物体,以避免损伤铲斗及其他零部件。

三是不可利用铲斗回转动作进行推土作业,以避免将铲斗及其他相关零部件损坏。

四是不可利用铲斗挖掘山体岩石,以避免对铲斗及其他零部件造成较大损坏。若必须挖掘岩石时,应先将岩石破碎后再使用铲斗进行挖掘。

如何挖掘新闻线索 篇5

最为一名记者,他最大的愿望是什么?当然是做出好新闻,得到受众的承认和好评,并且还可以有机会参评获奖。那么做出好新闻的前提是什么?当然是要先有好的选题,有人甚至这样说:有了好选题基本就相当于好新闻成功了一半。好的选题需要有好的新闻线索,发现、挖掘新闻线索是一名称职的记者必须要下的功夫。如何挖掘新闻线索?在从业过程中,笔者形成了几点心得,写出来与大家交流切磋:

一、从各种会议材料中捕捉新闻线索。有的记者不愿意参加会议,认为会议枯燥无味,只能平铺直叙的报道,出彩很难。那么会议材料中真的没有好的新闻线索吗?其实并不是这样,关键是记者要学会用眼睛采访,留心会议反映出来的新情况、新问题,练出一双敏锐的“新闻眼”,只有这样才能看到别人看不到的,听到别人听不到的,领悟到别人领悟不到的。也只有这样,才有可能捕捉到有价值的新闻线索,做出受众欢迎的新闻。例如在2008年召开的山东省东营市残联工作会议上,记者在会议材料上注意到有这样一句话:2007年,全市成立各类残疾人康复中心、医院6家,其中民办非营利性自闭症儿童康复中心1处。民办、非营利性、自闭症这几个字眼极大的引起了记者的兴趣,后来通过市残联工作人员,联系上了这家康复中心的创办人常桂亮,在与之交谈中,得知创办自闭症康复中心的初衷,原来他自己就有个患自闭症的儿子,为给儿子治病,他和对象可以说是呕心沥血,尝尽辛酸,但是最终效果不大,自闭症孩子给家庭带来了巨大的痛苦。因为自己的亲身经历,常桂亮便有了一个念头:办一所康复中心,为自己,更为其他的自闭症儿童的父母解除痛苦,历经波折、不懈努力,中心终于办了起来,然而在运营过程中也是困难不断,他都一个个挺了过来„„记者越听越兴奋,这是个不错的选题!经过采访挖掘,把它做成一期访谈专题节目——《天使的翅膀》,这个节目在后来的省市残联好新闻评比中分别获得二等奖和一等奖。

二、从与群众的交流中获得线索。2012年,记者带着预先定好的题目,到山东省利津县刁口乡采访,在刁口乡的渔民村,准备结束采访时,村民谈起了他们村里的一个医生,这名医生腿部残疾,在村里一干就是几十年,说起他的医德医术,群众无不伸大拇指。听了村民的谈话,记者感觉到这应是个不错的选题,后来专门又来到这个村,对这个乡村医生进行了深入的采访,终于挖掘出了一个自强不息、不为名利、扎根农村的乡村医生典型。乡里的宣传委员对记者说,这么近,这么多年,我们都没发现这个典型,一下子让你给发现了,眼光真毒。这个新闻东营电视台播出后,省里的电视、报纸记者又随后多次采访了这名乡村医生。

三、从事件的不同角度来发现新闻。上个世纪九十年代初,黄河断流,山东省东营市持续大旱,不但造成庄稼浇水难,连有些村庄群众的饮水都成了问题,这时新闻部门的报道不是旱情就是抗旱。这期间,有一次,记者随团市委组织的送水队伍给缺水的村庄群众送饮用水,在回来的路上,记者发现有些稻田里水分充足,水稻长势良好,大脑里不禁起了问号:为什么这里水源这么充足?于是到稻田所在村里询问,经了解得知,这个村一直重视水利工程的建设,兴建了三处水库,平时水库里都蓄满水,结果遇上大旱,这些水库便派上了大用场。记者马上把这个情况做成一条新闻——《大旱之年 这里不缺水》,当晚就播出了。没想到市里的主要领导看到这条新闻后,第二天就到这个村里去调研,后来东营市大兴水利工程,恐怕与此也不无联系。

四、从报道过的新闻里寻找新闻。有的人认为别人报道过的新闻再去做,就像别人嚼过的馒头你再去嚼,其实很多时候并不是这样,一条新闻从不同的侧面来看,可能会得出不同的结果。2013年4月8日,中央电视台一套节目《晚间新闻》栏目中,播出了一条新闻——《冷漠背后的真相》,记者看后深受启发。这条新闻是针对前几天网上热议一条报道,从

另一侧面进行采访的。网上报道的新闻大体内容是这样的:今年4月5日,吉林长春的一家菜市场,一名老人突然摔倒,177名行人漠然从老人身边走过,只有一名过路女子出手相助,直到医护人员赶到,老人才得以救治。此新闻一出,网民哗然,纷纷谴责那177名行人的冷漠。但是央视记者经过现场采访多位当事人发现,事实并非如此。原来老人倒地后,因为不明老人的病情,行人不敢贸然出手相助,但是很多人拨打了120急救电话,一名略懂医疗知识的女子对老人进行了护理,记者对医院医生的采访证明,老人得的是突发性脑梗塞,确实不宜贸然施救,否则会造成更严重的后果。这篇新闻之后还加了短评,“浮躁和冷漠一样有害,只顾眼球、不计后果的报道,会让更多的人依照残缺的信息,做出误判„„”,央视报道最终还原了事实真相。

挖掘机动臂耳板结构改进 篇6

1 动臂下耳板结构

如图1所示, 动臂下耳板结构主要由侧板、耳板、耳板加强板及下封板等四部分组成。其中耳板和耳板加强板通过销轴与动臂油缸相连。改进前的结构应力最大值为200MPa。

2 结构分析

分析强度需要先分析准确的内部结构, 耳板结构的正视图与剖视图如图2所示。

耳板破坏是由于受到的外部力大于自身的承受能力, 所以改善结构需要从两个方面着手:一是降低外界施加的力, 二是增强自身的承受能力。

对于外界力, 可以分解为两个方面:外部力和外部扭矩。在动臂油缸施加给动臂力的时候, 耳板受到作用力, 同时产生扭矩M。载荷继续传递, 侧板的焊缝就同时受到力F和扭矩M的作用 (如图3所示) 。耳板结构在传递力的过程中放大了外力, 产生的外力大小与结构尺寸L (耳板外挡距与箱体侧板的距离) 成正比。

对于耳板自身的受力能力, 从图3可以看出, 现有的耳板加强板只与耳板本身接触, 能够增强轴孔的局部强度, 但油缸传递来的力全部由耳板传递到下封板, 在这个受力过程中, 耳板加强板对整体结构的受力强度没有起到任何作用。

3 结构改进

1) 如图3所示, 油缸传递来的外力F值由整车系统决定, 无法靠结构改进进行改变;力矩M的大小由外力F与结构尺寸L共同决定。减小L的绝对值就可以有效减小力矩M, 当L为零, 即耳板与侧板平齐时, 力矩基本为零。当然, 考虑到焊缝过密会造成应力集中, L不应降低到零, 但适当的减小是有效的, 所以将L减小到10mm左右。

2) 将耳板加强板做成扇形, 与动臂下封板焊接在一起, 这样, 在受到外力的时候, 受力载体就不仅仅是耳板, 而是耳板和耳板加强板共同受力 (图4) 。

结构改进之后, 再次进行应力分析, 最大应力值降至15MPa。

4 结语

本文对小型挖掘机动臂下耳板的结构强度了分析, 并制定了改进方案。经应力分析对比, 发现改进后应力值大幅降低。投入实际生产后检验得知, 改进后的耳板强度显著增强, 故障率下降明显。

摘要:小型挖掘机动臂下耳板位置, 受力情况复杂, 强度要求极高, 对动臂整体的使用寿命极为关键。本文分析了下耳板外挡距、耳板加强板结构形式对耳板强度的影响, 并且提出了有效的改进措施。

关键词:挖掘机动臂,耳板,结构形式,外挡距,扇形

参考文献

[1]黄威, 张均保, 胡浪.塔机起升机构钢丝绳打扭的探究[J].装备制造技术, 2015, (9) :182-183.

大型挖掘机铲斗结构分析及改进 篇7

根据市场部分用户故障件反馈信息得知,某型号挖掘机铲斗故障率较高,并且80%都在700 h以内失效,所有的故障都发生在耳板与弓形板的焊缝处、侧板与加强板处(图1),由此推断该型铲斗结构设计存在一些问题,为了找出失效原因,现必须对其进行结构强度有限元分析,从而为铲斗结构改进设计提供理论依据。

通过实际分析,该挖掘机铲斗工作有2种典型工况,分别进行加载、计算分析,载荷情况如表1所示。

1 铲斗结构有限元分析

利用三维软件Pro/E的强大建模功能,在Pro/E中建立铲斗结构模型,然后导入Ansys Workbench中进行网格划分和有限元分析计算。铲斗材料为Q345B,该材料的屈服极限为δs=345 MPa,根据焊缝质量和铲斗作业环境,将焊缝处的许用应力定为175 MPa,其他部件的许用应力根据安全系数定为230 MPa。

1.1 正载工况

根据实际工作情况得出铲斗的最大挖掘力,平均加载至各齿,按图2确定边界条件,施加载荷。由图3可知,正载工况下铲斗复合应力最大为206.98 MPa,在许用应力范围内,此种工况下铲斗不易发生故障。

1.2 偏载工况

按实际工况中铲斗所受的最大挖掘力,单边一齿受力,且受最大侧向力,按图4确定边界条件,施加载荷。从图5可知,偏载工况下,耳板与弓形板的焊缝处最大应力为206.17 MPa,超出许用应力175 MPa;侧板与加强板处最大应力为240.51 MPa,超出许用应力230 MPa,容易出现疲劳失效,与实际失效部位相符。由分析结果可知,该铲斗结构强度需要改进加强。

2 铲斗结构改进设计

如图6所示,在保证铲斗的斗容和最大挖掘力不变的前提下进行结构局部改进,具体部位结构改进如下:(1) 3块弓形板对齐;(2)左右弓形板加厚4 mm;(3)背板中间缺口在原来的基础上补平;(4)背板两端加高50 mm并圆弧过渡;(5)左右加强板加长。

3 结构改进后铲斗结构有限元分析

3.1 正载工况

将改进后的铲斗按图7进行约束加载。由图8可知,正载工况下铲斗复合应力最大为172 MPa,在许用应力范围内,且应力较改进前大幅下降。

3.2 偏载工况

将改进后的铲斗按图9进行约束加载。从图10可知,偏载工况下,耳板与弓形板的焊缝处最大应力为142.94 MPa,小于许用应力175 MPa,侧板与加强板处最大应力为217.41 MPa,也小于许用应力230 MPa。

因此,改进后的结构均符合使用要求。

4 经济成本分析

改进后铲斗比改进前铲斗重约8 kg,按目前市场钢材成本5 000元/t计,约增加成本8×5=40元;改进后的铲斗增加了3个零件,分别是三角筋、斗前端加强板、耳板的垫板,同时取消斗内的L形加强板,这里主要考虑焊接成本,焊丝增加的重量约0.36 kg,按焊丝成本9元/kg计,焊丝的利用率取0.9,约增加成本0.36×9÷0.9=3.6元。总共约增加成本40+3.6=43.6元。总共增加的成本占产品总值不到1‰,但性能却得到了极大的提高。

5 结论

铲斗结构改进前,偏载工况下结构复合应力超出许用应力,结构易疲劳失效,改进后,正载和偏载工况下结构复合应力均大幅下降,降到许用应力范围内,满足了使用要求,且成本增加不多,稳定性能和可靠性能均得到了提高。有限元方法的分析结果是可靠合理的,其分析过程为相关工程机械设备设计分析提供了可行的方法和手段。

摘要:根据市场部分用户反映,某型号挖掘机铲斗断裂部位集中于耳板与弓形板、侧板与加强板处。针对其易发生失效的部位,建立有限元模型进行强度分析,得到关键部位应力云图,找出结构设计存在的问题,从而为改进设计、提高挖掘机工作稳定性提供理论依据。

挖掘装载机箱形伸缩臂的结构改进 篇8

1.箱形伸缩臂结构特点

工作时,箱形小臂和斗杆之间频繁滑动,由于钢板之间不可直接接触摩擦,所以必须在2个矩形箱体间加装耐磨承力滑块。MC尼龙具有较高的强度、刚性、韧性、耐磨性、耐疲劳性,且热变形温度高、尺寸稳定,适合作为承力滑块材料。

滑块布置在箱形小臂的前端和斗杆的末端(见图2、图3)。滑块与斗杆、箱形小臂之间间隙可通过调整滑块下的垫片来调节。间隙太大易产生晃动,而间隙太小又会发生卡滞。经过反复试验,间隙取1.5 mm为宜。

1.铲斗2.箱型斗杆3.铲斗缸4.箱型小臂5.动臂

1.斗杆2.调整垫片3.箱形小臂滑块4.润滑油杯5.箱形小臂6.润滑槽

为减小滑块与结构件之间的摩擦力,需要使用润滑脂对滑块进行润滑。由于斗杆上固定的滑块与箱形小臂之间的间隙外露,可直接在箱形小臂上涂润滑脂;而箱形小臂上固定的滑块与斗杆之间的间隙内藏,不便于润滑。为方便润滑,需在斗杆上安设加油杯,并在滑块上开沟槽储存润滑油。

在不使用伸缩臂的状况下,为避免伸缩缸受力,可在斗杆与箱形小臂重合位置安设通轴。为便于插拔,在轴末端可加装弹簧钢B形销,如图4所示。

2.箱形小臂和斗杆加工工艺

1.斗杆2.调整垫片3.斗杆滑块4.箱形小臂5.贴板

在加工箱形小臂过程中,因对箱形小臂结构外表面与斗杆内表面的平面度、粗糙度以及4个平面之间的垂直度要求较高,因此在4块钢板焊接后,通过铣削平面来保证4个平面之间的垂直度≤0.5mm、粗糙度≤3.2μm。

斗杆内表面无法加工,其4块钢板下料后,需先用校平机校平,再铣上、下封板的2个侧面。为保证4个平面的相互垂直度,焊接时使用工艺块对接左侧钢板和上、下封板。去掉工艺块后,再焊接右侧钢板。如图5所示。

3.斗杆受力分析

伸缩臂结构中的斗杆主要承受弯矩,在装配过程中曾出现D点钢板弯曲变形问题。现把斗杆、四连杆和铲斗作为一个独立体进行受力分析。当斗杆完全伸出后,独立体受力情况如图6所示。

由于C点的弯矩Mc=0,按下列公式计算Fd数值:

经计算,Fd为21497N。Fd作用于图7所示钢板上的受力可简化为简支梁,即假设力Fd均匀作用于钢板受力面上,如图8所示。其均布载荷q的计算如下:

该钢板中点处弯矩M计算如下:

式中:q——均布载荷;

L——钢板长度。

该钢板抗弯截面系数W计算如下:

式中:b——钢板宽度;

h——钢板厚度。

正应力σ计算如下:

暂选Q345A高强度结构钢作为该处板材,其屈服点应力为345MPa。

G——独立体重力C——斗杆端部上侧受力点D——斗杆端部下侧受力点Fc——箱形小臂C点处对独立体的力Fd——箱形小臂D点对独立体的力L1——G到C点的垂直投影距离L2——Fd到C点的垂直投影距离

考虑到该钢板受力不均匀和受力点选取的误差等,取安全系数n为2.5,

则许用应力[σ]计算如下:

[σ]=345/2.5=138 MPa

经过以上计算,得出正应力σ>许用应力[σ],说明斗杆D点强度不够。

4.改进斗杆结构强度方案

根据斗杆受力分析,决定从以下几方面改进斗杆结构强度:

将受力板厚度h,由12 mm增加至16mm;在结构允许的情况下增大受力板宽度b,以增大受力面积,同时适当减小L1尺寸、增大L2尺寸,以减小Fd。

斗杆材料选用Q460C高强度结构钢板材。选用此种钢板,一方面可使斗杆的矩形箱体板厚度适当减小,从而减小斗杆质量;另一方面可将许用应力增大至460MPa,若还取安全系n为2.5,则许用应力[σ]将增加到184MPa。

伸缩臂比普通臂长1 m多,当斗杆完全伸出去后会影响整机的稳定性,因此当使用伸缩臂作业时,应选配小质量铲斗,附表为常用2种铲斗技术参数。

由于铲斗对D点产生的力矩最大(见图6),因此减小铲斗的质量并提高铲斗的切削力,将起到事半功倍的效果。

铲斗的切削边、刀刃、斗壁和铲斗的尺寸对切削力影响较大。为此将铲斗侧壁后缩,并适当减小铲斗宽度,以增大铲斗的切削力。在保证强度的前提下,通过优化铲斗结构尺寸,共将铲斗质量减小30 kg。

通过以上结构改进,得Fd=20 kN,均布载荷q计算如下:

中心处的弯矩计算如下:

抗弯截面系数W计算如下:

正应力、许用应力计算如下:

结构挖掘 篇9

1 云计算的特点以及服务模式分析

1.1 云计算的特点

云计算是一种基于用户需求,为用户提供主动服务的超级计算模式。云计算能够为用户提供共享的服务模式,并且能够支持多个用户的不同需求。云计算能够满足不同规模的计算需求,由信息和资源处理中心对需求进行快速的分析和调节,并进行云计算。云计算采用按量计费的方式,用户不需要对没有消费的服务买单,这样既能够降低成本,又能够避免造成浪费。

1.2 云计算的服务模式分析

云计算的服务模式主要包括以下几个方面:

1)Iaa S,Infraslruelure as a Service——基础设施即服务,根据用户权限,可以直接方位云计算提供的网络宽带、分布式储存、并行运算等基础设置,同时可以根据自己的需求,搭建负荷自己需求的平台;

2)Paa S,Platform as a Service——平台即服务,云计算能够为用户提供一个平台,包括工具集与软件开发语言,其能够为用户组建一个虚拟的操作系统,用户根据自己的需求在该平台上开发以及部署相应的平台与应用;

3)Saa S,Software as a service——软件即服务,用户根据自己的需求,使用基于云计算架构的应用程序为自己服务,例如网络储存、在线表格、在线文档、电子邮件等。

2 基于Map Reduce的Page Rank算法分析

2.1 基于Map Reduce的Page Rank算法的实现

2.1.1 算法数据准备

按照链接结构文件格式将文件转换成针对每一个节点的出链接结构文件,其中预处理数据包由网页上的海量数据信息组成,在map执行的过程中,按照map方法,生成所有起始节点的目标点的<key,value>,其中key表示起始节点,value表示目标节点,每一个key为初始化Page Rank值,然后输出数据到HDFS。

2.1.2 算法的实现

Page Rank算法输出的每个节点,按照Map方法对输入每一行记录的目标节点顺序,按照每个key归类Map Reduce框架采集map方法对应的value。按照reduce方法,将每一个key:页面y,对<list of partial>的所有项进行加和,然后带入公式:Pk + 1=d ATPk+(1-d)(公式1)计算,其中,PK表示第k次迭代后的Page R⁃ank向量,AT表示矩阵的转置矩阵,然后输出所有页面全新的Page Rank,即获得所有key初始化的Page Rank值,在HDFS中储存所有的计算结果,进行下一次迭代计算。在迭代计算过程中,Mapper对所有起点的目标点生成一个与之对应的partial,然后把所有的partial传送至Mapreduce中。

2.2 基于Map Reduce的Page Rank算法的改进分析

2.2.1 迭代并行Page Rank改进算法分析

按照Page Rank算法的传统计算公式,推算Page Rank算法的向量公式,即公式1,因此按照初始向量P0进行向量Pk的递推,过程表现为:

通过上述递推过程,以跨度为2计算公式为:P2= d2(AT)2P0+d(1-d)ATe+(1-d)e

迭代并行Page Rank改进算法的过程表现为以下几个方面:1)在计算之前,应该先生成和跨度相关的邻接矩阵,以k=2为例,采用Map Reduce计算AT,根据Map Reduce过程获得(AT)2,Map Reduce在迭代的过程中,以初始Page Rank向量、AT以及(AT)2为输入文件,最后生成相应的Page Rank向量,按照上述步骤进行反复迭代,如图1 所示。按照“移动计算比移动数据更经济”的思想,应该尽可能将被计算的数据储存在原来的位置,避免出现数据大量移动的现象,这样既能够提高系统吞吐量,又不至于造成网络的堵塞。因此,HDFS中储存的AT以及(AT)2不会随着迭代的改变而改变。当k=2时,可将算法分为三个阶段:1)输入上述阶段生成的链接构成文件G,并用G代替邻接矩阵的AT,将首列作为目标节点,第i行,第j列节点用ATi,j表示;2)使用第一阶段获得的AT,生成相应的链接结构文件,然后获得相应的矩阵,通过计算获得(AT)2;3)k=2,因此每次的迭代跨度都为2,采用迭代并行Page Rank算法计算向量,输入第一阶段获得的AT,计算d(1-d)ATe+(1-d)e,输入第二阶段获得的(AT)2,计算d2(AT)2P0,获得新的Page Rank向量,并保存在HDPS中,再进行下一次迭代计算。

2.2.2 矩阵分块并行Page Rank改进算法分析

矩阵分块并行Page Rank改进算法,用矩阵如图2所示,Re⁃duce阶段的额外性能消耗,通常来自于排序阶段与混合阶段,如果在排序阶段中存在众多key关键词,将会消耗了大量的时间,如果将块大小设定为b,通过Map Reduce处理之后的向量块、数量块等将会减少为1/b。采用矩阵分块并行Page Rank算法进行改进之后,一个向量块能够表示b条向量块,而且改进之后向量块之间并不存在外链接的节点,因此不会生成相应的记录,这样能够有效的节省大量邻接矩阵空间,从而降低储存空间的消耗。同时,由于不需要记录之前b条向量,记录的总条数明显降低,占用的内存量显著降低,进而境地I/O消耗,由此可见其优势。

3 结束语

总而言之,Web网页上的信息量显著增加,并且日增长量呈指数级发展,面对如此多的数据信息和庞大的Web信息资源库,想要从中获得用户所需要的信息和知识,其难度可想而知。文章探析的一种基于云计算的Web结构挖掘算法,即基于Map Reduce的Page Rank算法,能够更加快速、准确地从Web网页中提取用户所需要的信息和知识。同时,基于云计算的Web结构挖掘算法的研究和应用尚处在初级阶段,还需要从以下几个方面进行研究:

1)研究能够在高压力、高并发以及大容量的Web环境中运行的K-span算法。

2)加强对Hadoop调度机制的深入研究,使Hadoop算法变得更加准确、高效。

3)实现算法从单机平台向云计算平台的转移,充分利用云计算高效、准确的优势。

虽然上述几个方面还需要我们深入的研究,但是,基于云计算的Web结构挖局算法,以其强大的计算与储存能力,受到社会各界的广泛关注。

参考文献

[1]倪靖.一种基于云计算的Web结构挖掘算法[J].电脑知识与技术,2011,7(24):5933-5935.

[2]蓝昊慧.云计算在Web结构挖掘算法中的运用研究[J].计算机时代,2012(10):30-32.

[3]李远方.基于云计算的Web结构挖掘算法研究[D].云南:云南大学,2011.

[4]胡或,封俊.Hadoo P下的分布式搜索引擎[J].计算机系统应用,2010,19(7):24-26.

[5]王鹏.云计算的关键技术与应用实例[M].北京:人民邮电出版社,2010.

Web结构挖掘在搜索引擎中的应用 篇10

搜索引擎是网络中信息搜索的主流工具, 如何检索出有用信息是现代搜索引擎的主要目标。

Web结构挖掘主要是从WWW的组织结构和链接关系中推导知识, 通过对Web站点的结构进行分析、变形和归纳, 将Web页面进行分类排序, 发现重要的页面。Web结构挖掘在对页面间链接分析进行处理时常用的是页面等级 (PageRank) 方法, 该方法在对关键字进行检索后, 将结果进行页面等级分析, 根据页面重要性进行输出。

2 PageRank核心算法分析

PageRank是Web结构挖掘中应用最成功的算法之一, 著名的搜索引擎Google就是利用该算法和链接文本标记, 词频统计等因素相结合的方法来对检索出的大量结果进行相关度排序, 将等级值高的网页尽量排在前面。

2.1 PageRank基本思想

PageRank的基本思想是一个网页的质量和重要性既要通过其它网页对其超文本链接的数量来衡量, 还要考虑到所有链接的网页对它的推荐能力。推荐能力是指由于某网页对网页B的链接, 使人们认为网页B的重要程度。一般网页本身的PR值越高, 则它对别的网页的推荐能力就越大。据此, PageRank计算出每个网页的重要性综合指标。

2.2 PageRank核心算法

在计算PR值时, 一般把它看作一个求矩阵特征向量的过程:M表示G的过渡矩阵, 如果存在节点j到节点i的边, 则置矩阵中元素mij的值为1/Nj, 否则置为0。这样, 最终的结果满足:x=Mx。

其中x表示各页面的PageRank值构成的向量。矩阵M最大特征值为1, x为1对应的特征向量, 之后用简单迭代法对上式求解。要想保证上述迭代过程的收敛, M必须是不可约的和非循环的。通常在迭代过程中加一个潮湿因子M'以保证M的不可约。M'=cM+ (1-c) [1/N]N×N, 在迭代过程中用M'代替M, 此时迭代形式变为

由于潮湿因子的引入, 在保证迭代收敛的同时, 也使PR值发生变化:

其中T1, T2……, Tn表示有链接指向页面A的页面, NTi表示页面Ti的出度, c是取值0到1之间的衰减因子, c通常取0.85。

本算法虽然可以很好地完成页面的等级排序, 但是它还是有很多不足之处。首先本算法在PR值计算过程中, 认为页面Ti把自己的PR值平均分配给了它所指向的页面, 也就是说如果用户当前浏览的页面Ti, 该页面有NTi个链接指向其它页面, 那么用户下一步浏览这NTi个页面的概率都是相同的1/NTi, 而在实际操作中, 用户浏览这NTi个页面时首先浏览的是那些与当前页面内容相关性大的下一个页面, 对于所有页面的浏览概率是不可能相同的, 所以本文以此作为突破点对传统PageRank算法做了一些改进。

3 基于页面相似度对该算法的改进

本改进考虑将页面相似度引入到PageRank算法中, 使Web页面的重要性不仅由链接结构决定, 还要受到Web页面内容的影响。

3.1 页面相似度

页面相似度就是页面A和页面B由两个特征向量C和P表示, n表示特征向量所收录词的总数, W1, W2…Wn为出现频率排在前n位的词, Fwi为词Wi在A中出现的频率, fwi为词Wi在B中出现的频率, 特征向量C和P分别表示为 (fW1, fW2…fWn) 和 (FW1, FW2, …FWn) , 则页面A和B的相似度函数定义为:

3.2 基于页面相似度的算法改进策略

基于“用户优先浏览与当前页面内容相关性较大的下一个页面”将页面相似度引入算法中, 体现出用户对NTi个页面访问概率的不同。

(1) A为表示Web结构的邻接矩阵, 其中元素

(2) 引入页面相似度矩阵S, 其中Sim (Pi, Pj) 表示两个Web文本文档Pi, 和Pj相似度, i, j=1, 2…n;

(3) 引入矩阵A', 使得a'ij=aij×sij;

(4) 根据A'得到新的M", 其中;

(5) 相应的迭代公式为:PRi+1=cM"×PRi+ (1-c) ×[1/N]N×1

(6) 由此得到改进后的PR值:PR (A) = (1-c) /n+c[PR (T1) ×m1"+…+PR (Tn) /mn"]

其中的mi"为链接指向A的Pi页面对应于M"中的值。

4 实验分析

我们建立如图1的Web页面结构图, 同时假设各Web页面相似度矩阵为T, 根据公式 (4) 可知矩阵T中所有元素取值范围都在0与1之间, 为避免出现“页面雷同”, 可将所有值都设置为小于0.8;为了突出页面相似度的作用, 人为设置每个页面链出的所有边对应的相似度值均不同。

通过图1可以构建相似度矩阵T, 该图中每两个节点间的数据代表这两个网页内容的相似度, 无链接关系的网页在矩阵中用*表示。

本实验采用C++编程来求解页面的PageRank值, 每个页面的PR初始值均设为1, 迭代终止的差值设置为10-10, 分别使用两种算法来计算各页面的PR值, 并根据计算结果对网页进行排序分析, 具体实验结果如表1所示。

根据计算结果, 对页面进行排序, 基于传统算法的页面顺序是P4>P1>P2>P5>P6>P3, 而使用改进后的算法得到的页面顺序是P4>P6>P1>P2>P3>P5。

根据这个实验结果可以看到:由于引入了页面相似度, 使得页面排序发生了很大变化, 以页面P6来说, 其重要性由传统PR值中的第5位升至了改进后的PR值得第2位, 究其原因是在两种算法中排序均处于第一位的页面P4的影响, 在传统算法中P4向两个链出页面平均分配PR值, 所以他们各得二分之一, 而在改进后的算法由于页面相似度的引入, PR值得分配发生变化, P6得到的了三分之二, 这极大提升了P6本身的PR值, 使它的排序发生显著变化, 而这种变化既达到了对算法改进的目的, 又符合用户对网页的浏览习惯。如果在搜索引擎中使用这种改进后的算法, 最终查询到的搜索结果也会随着页面排序的变化而变化, 可以使更有用的页面排在较靠前的位置, 提高搜索引擎的查准率。

5 结束语

本文主要分析了常见的基于Web结构挖掘的传统PageRank算法, 并提出了基于页面相关度的改进算法。改进后的PageRank算法主要根据页面内容的相似度来度量网页链接的重要性, 从而提高算法区分链接重要性的能力。实践证明, 改进后的算法在寻找相关网页时比传统PageRank算法的查询质量有明显的提高。

摘要:介绍了搜索引擎和Web结构挖掘的相关知识, 重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法, 通过实验证明, 改进后的算法可以使搜索引擎的性能得到极大的提高。

关键词:搜索引擎,Web结构挖掘,PageRank算法,页面相似度

参考文献

[1]毛国君, 段立娟, 王实, 等.数据挖掘原理与算法[M].北京:清华大学出版社, 2005.

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【结构挖掘】相关文章:

智能挖掘05-04

人性挖掘05-21

行为挖掘05-23

知识挖掘06-03

挖掘数学06-04

挖掘问题06-08

挖掘素材06-15

研究挖掘06-25

煤矿挖掘06-26

热点新闻挖掘04-11

上一篇:油库精细化管理下一篇:激发潜力