计算机技术书籍推荐

2024-06-10

计算机技术书籍推荐(精选8篇)

篇1:计算机技术书籍推荐

姓名:XXX国籍:中国目前所在地:广州民族:汉族户口所在地:四川身材:165 cm婚姻状况:未婚年龄:22 岁求职意向及工作经历人才类型:好范文应聘职位:软件工程师/软件测试工程师:现场实施、网络工程师:计算机机相关设备维护、软件工程师/软件测试工程师:项目售前售后技术支持工作年限:2职称:无职称求职类型:全职可到职日期:随时月薪要求:2000--3500希望工作地区:广州个人工作经历:公司名称:广州鸿博起止年月:2009-02 ~ 2009-03公司性质:私营企业所属行业:计算机业担任职务:系统实施工作描述:负责基于red hat linux的系统安装和售后技术支持。离职原因:公司名称:珠海金步电子有限公司起止年月:2008-01 ~ 2008-03公司性质:所属行业:担任职务:程序员工作描述:离职原因:公司名称:数普起止年月:2007-06 ~ 2008-12公司性质:私营企业所属行业:担任职务:销售员工作描述:销售各种应用软件和系统软件,负责软件的安装维护等售后服务。

协助公司领导发展自己的客户和合作伙伴。

笔记本/台式机及周边耗材销售离职原因:教育背景毕业院校:海南大学三亚学院最高学历:本科毕业日期:2009-06-01所学专业一:计算机科学与技术所学专业二:受教育培训经历:起始年月终止年月学校(机构)专 业获得证书证书编号2005-092009-06海南大学三亚学院计算机科学与技术scjp语言能力外语:英语 良好国语水平:一般粤语水平:一般工作能力及其他专长项目经验:

网上商城、BBS、网上聊天系统、学生成绩汇总系统

技术认证:

Sun公司认证scjp

Java二级

奖励:

2006年9月 学院二等奖学金

2007年9月 学院三等奖学金

2007年9月 国家励志奖学金

技术技能:

测试工具与技能:xUnit系列

Jnuit 3.x和4.x单元测试。

Cactus+Jetty进行jsp,Servlet,Filter测试。

jsUnit进行javascript测试。

DBUnit进行数据库测试,Junit+Apache p01组件+Junitperf自动生成Excel性能测试报告。

Cobertura进行自动覆盖率测试和生成测试报告。

EasyMock和Mock进行模拟测试,JMeter进行压力测试。

语言基础:c,Delphi,java(主攻)

开发平台:j2EE

开发工具:eclipse,Dreamweaver、photoshop.Netbeans,myeclipse

容器:Tomcat+Jboss+Jetty.数据库:精通mysql.熟悉oracle,sqlserver

语言:精通j2se,html,javascript,JavaBean,servlet,jstl,jsf.jsp.xml,Ajax.熟悉ejb,struts,spring,hibernate.详细个人自传自我评价:

一直相信付出就有收获,更相信事在人为。努力为团队,为自己创造一片蔚蓝的天空。

月薪要求:2000-3000元个人联系方式通讯地址:广州市,番禺区(邮编: 511450)联系电话:134XXXXXXXX家庭电话:手机:134XXXXXXXXQQ号码:XXXXXXXX电子邮件:XXXXXXXXXXX@sina.com个人主页:

篇2:计算机技术书籍推荐

本人于韶关市第二技师学院担任计算机专业教师的工作已经整整五年了,在2011-2016年这五年里我就任现职以来的工作情况作如下分析和总结:

一、基本情况

本人于2011年6月毕业于湛江师范学院,工业设计专业,工学学士。于2011年8月通过面试进入韶关市第二技师学院,担任信息工程系,即计算机专业教师,至今已满五年。自参加工作的这五年来我一直担任学院信息工程系计算机专业教师,主要从事数码设计类专业的教学。我发挥青年教师的优势,教学风格灵活创新,深受学生的欢迎和喜爱。

在韶关市第二技师学院工作期间,我所讲授的课程包括:Photoshop图形图像处理、CorelDraw平面绘图及项目实战、Adobe Illustrator、Corel Painter图像绘制、三大构成技法训练、素描、平面设计基础、广告设计基础、Sketch Pad数位板的使用、计算机应用基础、Auto CAD二维及三维绘图等课程,其中包括理论、实操及一体化课程的教学。总课时为2034节,年平均课时为407节,任教的班级及格率达95%以上。工作期间我还担任了12春季动画制作班的班主任。

从教五年来,我一直奋战在教学岗位的第一线,勤勤恳恳、兢兢业业、尽职尽责,被评为学院“优秀教师”、“优秀党员”;撰写的论文《CorelDraw平面设计课程改革的探索与实践》发表于《当代教育实践与教学研究》2016年7月刊同时被评为该刊物当月优秀论文评比“一等奖”;制作的课件《镜头运动效果》获得首届全省技工院校教师多媒体课件制作大赛“一等奖”,全国职业优秀教科研成果“一等奖”;作为指导老师指导并带领三位学生参加第二届广东省“挑战杯——彩虹人生”2016职校创新创效创业大赛,三个作品均在创意类作品取得了成绩,分别为一个“二等奖”和两个“三等奖”。五年来。本人在教育、教学、教研方面均取得了一定的成绩,符合申报计算机科学与技术讲师资格。

二、政治思想和道德方面

作为一名共产党员,我时时刻刻以一名合格的党员的标准严格要求自己。我始终明确政治目标,注重品德修养,坚持党的四项基本原则,坚持党的教育方针,忠于教育事业。五年来,我从未缺席过一次党员学习,认真贯彻教书育人的思想,为人师表,爱校爱生。在工作中具有高度的责任心、严谨的工作作风和良好的思想素养。热爱本职工作,和全体教师团结协作,共同关心培育学生,帮助学生树立正确的人生观,科学的世界观。

本人服从学院安排,按学院要求做好各项工作计划,不计个人得失,个人利益服从于集体利益,具有奉献精神。自参加工作以来,我担任过计算机专业课程教师、培训班指导老师、班主任等各项工作,在实际的生活中我认真做好了每一项工作。我为人谦和,待人诚恳,生活和工作原则性强。平时和同事们和睦相处,对同事在处理电脑故障、制作课件等方面的要求总是尽力去帮助。

三、日常教学、学生管理方面

作为一名计算机教师,我深刻地认识到计算机教学在现今形式下的地位越来越重要,认识到计算机课程教学是现代教育教学中培养创新型人才的重要途径。因此,我深知自己责任之重大,对自己严格要求,工作一丝不苟、精益求精,每学期都能圆满地完成教学工作。一直是把搞好课堂教学、提高教学质量放在工作的首位。

首先我不断学习,提升自己的业务能力,我明白,“要给学生一杯水,教师必须要有一桶水”,这应该是作为教师这行必须始终坚持的道理。为了扩展自己计算机教学方面的知识和技能,我除了一遍又一遍地钻研教材外,还经常跑书店查阅课外书籍,进论坛看贴、提问,向老师谦虚请教等等。

其次,认真备好每一堂课,“课上十分钟,课下十年功”,我认为这讲的就是备课的重要性。课常上的时间很短暂,要求非常高:

1、要保证所讲内容的正确性与科学性;

2、要注意教学循序渐进;

3、要达到教学效果;

4、要考虑到学生的接受能力等等,涉及的方方面面都要考虑到。以上这些要考虑的方方面面并不是靠课上四十五分钟教师的临时发挥,而是靠课前充足的时间准备,还要在课后不断的总结,这一点,五年来,我都坚持做到了。

第三,以学生为主体,教师为主导自始至终,我们都应该把学生摆在主体位置,因为学习的主人就是学生。为了做到这一点,我上课时主要采用启发式教育方法。对重点和难点,我一般都是自己先提出设问,并给三到五秒时间让学生思考,然后进行讲解;对于比较容易的,我仔细讲解一遍,有必的话叫学生复述或回答,之后,我再对其做补允。

最后,要与学生要多交流,在与学生交流的过程中,就可以知道学生学得怎么样,从而改进教学;可以了解学生情况,达到有针对性地教与管;可以增进师生友谊,使得学生更配合你的工作,因此,五年来,我所任教班级的学生都很喜爱我。

四、班主任工作方面

我所负责管理的班级是12动画制作春季班,从他们入校报道到安排宿舍,再到开始在校园的学习生活,我都和他们在一起。春季班的学生较秋季班而言,他们的个性更加鲜明,更加活泼,更加有特点,因此,在班级管理方面我需要下更大的功夫。提到春季班,或许在别人眼里他们是所谓的“差生”,但于我而言,他们像是一个个小精灵,带着各自的特点来到我面前,每一个人都有他独到的一面。

明确了班级的特点后,我从“爱”入手,试图站在他们的角度理解他们,包容他们,与他们成为朋友。渐渐地,我发现,他们每一个人都有自己的特点与特长,有的擅长画画,有的擅长软件操作,有的综合能力较强。为了了解每一个学

生,我每天都尽量抽出时间和他们在一起,课间和他们一起聊天,晚自习时和他们说说话,课后去宿舍看看,在闲谈过程中了解他们的基本情况,家庭情况,与学生的关系是师生,更是朋友。经过一段时间的了解,知道了许多,了解了孩子们的一切,我才能有的放矢地去关怀他们。如今,已经毕业的他们还时通过电话短信等方式和我交流,告诉我他们现在的生活点滴,这也让我感到几年的班主任工作没有白做。

五、教研方面

从事计算机专业教学以来,我积极参与教研活动,不管是系部举办的还是教研组举办的,我的尽量参加,并且认真学习总结。平日里,只要有空余的时间,我都会和同教研组的老师探讨关于教学中的问题,互相听课,互相总结经验与不足。关于教研成绩,刚接触工作的我由于教学经验不足,参与的一些教研活动的比赛都没有能够取得成绩,随着参加教研活动及比赛的增多,我也积累和总结了相关经验,越战越勇,在其后参加的一些比赛中取得了一定的成绩,其中不乏国家级和省级的比赛。这也让我更加重视教研,在今后的工作中将继续努力,在教学中渗透,精益求精。此外,我还参加了2016年《中英广告设计教育精英师资研修班》,在为期一周的培训学习中,与英国专家及全省技工院校的专业教师共同学习、探讨、交流。通过听课、讨论、实践等环节学习了许多广告设计方面了知识,了解到许多兄弟技工院校教学方面的特点,受益匪浅。通过本次培训,我对广告设计专业教学又有了新的认识。

总之,在韶关市第二技师学院工作的五年来,我尽职尽责地做好每一项工作,圆满地完成了各项教学任务,有一定的教育、教研、管理和指导能力,具备计算机科学与技术讲师的资格。今后,我将在自己的工作岗位上继续努力工作,提高自我,为技工教育事业奉献自己的力量。

总结人:刘佳

篇3:计算机技术书籍推荐

由于推荐系统应用的普及,提高系统的用户体验一直是各个系统应用不断的追求。由于推荐系统中的推荐算法在运行过程中涉及大量的数据计算过程,而海量数据环境下,运算所需的时间越来越大,实时完成系统应用是面向海量数据推荐系统的瓶颈点。面对海量数据的存储,常用数据库早已超出负荷,系统的可扩展性问题也日益凸显。针对其瓶颈点,很多研究方案被提出,但将精度、实时性和可扩展性同时完美的融合在一个系统中是该领域一直以来面临的挑战。

针对传统推荐算法面向海量数据时的可扩展性和数据稀疏性问题,基于分布式环境下的数据挖掘和并行处理技术,本文除对推荐算法本身进行优化改进外,提出了一种基于Hadoop分布式平台完成推荐算法分布式实现的改进方案,即使用对海量稀疏数据具有良好支持的HDFS来存储用户交互矩阵并将其作为数据源,同时基于Map Reduce分布式计算框架,将推荐算法的计算任务均衡地分配给Hadoop集群内的每台机器,从而有效地提高推荐算法的执行效率,同时在大规模分布式数据计算点,再次有效地将GPU引入进行辅助计算。

1 基于扩展向量的推荐模型

将新模型具体应用在基于项目的协同过滤推荐算法中,优化后的算法流程如下:

扩展向量:基于新模型对项目的特征向量进行扩展,即可得项目的扩展特征向量表示为:

式中:eitemj表示第j个项目对应的扩展特征向量,1≤j≤M,M为站点中的项目集合I的总数;p(i,j)表示第i个用户对第j个项目的偏好值,l≤i≤N,N为站点中的用户集合U的总数;aitem(j,k)表示第j个项目本身具有的第k个属性值,l≤k≤Q,Q为站点中项目的属性个数。所述偏好值可以代表系统中用户对项目的评分大小、评论长短、购买与否以及浏览次数等信息。所述项目属性值可以是项目本身具有的项目内容、类别、价格、年份、适用人群,产地等属性信息。同理,用户的扩展特征向量可以表示为:

式中:euseri表示useri的扩展特征向量,liN,N为站点中的用户总数,p(i,j)表示第i个用户对第j个项目的偏好值;auser(i,k)表示第i个用户本身具有的第k个属性值,l≤k≤R,R为站点中用户相关属性的个数。具体的,所述用户属性值可以包括年龄段、性别、专业类别等。

最近邻搜索:最近邻搜索意味着寻找目标项目的最相似邻居。所有的相似度计算基于扩展特征向量和相似性度量方法展开,优化后的相似性度量方法具体如下所示:

基于欧式距离的相似度,如下:

基于谷本相关的相似度,如下:

式中:sim′(j,j′)表示对象j和对象j′的扩展特征向量之间的相似度,其相似度计算方法基于扩展向量展开。其中,基于项目的协同过滤算法即为计算候选被推荐项目与其他项目的相似值,itemj和itemj′代表两个不同的项目,Uj代表对itemj给出评分的用户集合,Uj′代表对itemj′给出评分的用户集合,Aj意味着itemj的属性信息集合,Aj′意味着itemj′的属性信息集合。由于项目的扩展特征向量考虑了项目本身具有的属性信息,使其参与相似度计算的向量更加精确,所以在理论上相似度是更加准确的。完成所有相关的计算后可以得到项目的相似矩阵。而且基于sim,项目的最近邻居也被获取到。

得到预期偏好矩阵:计算候选推荐项目的预测评分值,如下:

式中:R′(u,j′)用来评估用户useru对itemj′的偏好值,其计算基于目标项目的最近邻的偏好值;Iu代表对用户u给出过偏好值的item集合。

做出推荐:对候选推荐对象的推荐值R′(u,j)按照从大到小的顺序进行排序。选取前W个项目推荐给用户useru,W是人为设定的某一正整数。经过上述操作步骤,即可完成新模型在基于项目的协同过滤推荐模型的应用。

2 云计算环境下大数据的推荐系统设计

2.1 系统的体系结构

不同时期的推荐系统,面对的数据量也有质的不同,从几十条记录到现在的一千万条记录,单机的推荐系统已无法满足其处理需求。

面向海量数据的推荐系统的架构如图1所示,其构建于物理集群之上,基于本地数据库和推荐算法的使用,为用户提供注册、节目推荐和节目交互等功能,其中节目交互包括新节目的推荐榜单、热播节目的榜单、用户对节目评分,以及用户可以获取对其产生的推荐列表等功能。其中系统将服务工程中产生的数据存储在文件中,并部署在HDFS上,并运用Map⁃Reduce并行计算框架和CUDA并行计算框架处理系统运行过程面对的海量数据处理问题,最终高性能、高质量的完成系统的各个功能,提高用户的体验。所以,从下至上,系统的体系结构分为三成:物理资源层、数据处理层(存储和计算)和应用层。

2.2 系统的数据支撑平台的设计

系统的数据支撑平台的设计如图2所示。对于面向海量数据的推荐系统,在用户数量较多的情况下可以对其按照地域进行分区存储,将系统应用层涉及的目标用户的最终推送数据存储在目标用户对应的地域数据库中。本地数据库对应的数据库表增加分区partition即可。这些数据库可以部署在不同的地域。对于每一个用户,其对电影的评分信息存储在分布式文件系统中,分布在该地域的Hadoop集群上。因为大多数对数据库的访问操作都具有局部性,所以,通过地域进行划分,降低了数据传送的代价,而且当网络出现故障时,仍然允许对局部数据库的操作。

由于底层采用HDFS,所以可以存储海量数据、也便于扩充。利用地域进行数据分区,对用户推荐的同时间接考虑了地域文化,一方水土孕育一方文化,一方文化造就一方人的性格,利用人性格的地域同一性使得对用户的推荐更加准确。

2.3 系统的智能推荐模块设计

(1)推荐算法的选择

系统采用提出的新混合算法,即基于项目的Slope One分布式推荐算法,对应于混合推荐算法文本框。此外,本系统还采用了基于双重相似的协同过滤推荐算法、ALS⁃WR多种推荐算法彼此并行运行。对于系统提供的功能,采用多种算法呈现结果,可以最大程度地消除冷启动问题,同时可以为用户提供更为丰富的推荐列表供其选择,最大程度地满足用户的需求。

(2)数据预处理模块

数据预处理模块的功能分为两类:一种是对从系统功能层取得的数据进行优化整合并转化成算法需要的数据源格式存储在数据支撑平台的HDFS上;第二种是将推荐算法所需要的数据从数据支撑平台获取,进行相应的优化整合转化成算法所需要的二次数据源,供算法运行过程中使用。由于数据预处理过程中涉及的数据处理可以分为离线进行和在线进行两种,所以提高数据支撑平台利用率的同时也减小了系统的在线负载。其中可以离线进行处理的数据,比如对HDFS上的数据进行定时更新、选择性存储并更新算法运行过程中产生的临时文件以供下次使用,比如项目与项目之间的相似性文件等。

(3)算法运行模块

算法运行模块功能为运行基于Hadoop的推荐算法。其中输入为数据库中经过数据预处理得到的数据源,比如,系统指定格式的用户对项目的评分数据。输出是系统各项功能中所需的数据,比如对目标用户的具体的推荐项目列表。

3 推荐结果评估及系统实现

仿真实验对三种推荐算法分布式实现的实验结果进行呈现和分析,具体包括评估标准的介绍、实验数据集的选取以及不同维度推荐效果的对比。

本文取用Group Lens实验室提供的Movie Lens 100K,1M以及10M数据集,其中分别包含了十万条,一百万条和一千万条用户的偏好记录。这些信息记录是从1997年9月19日—1998年4月22日,7个月时间里Movie L⁃ens网站(movielens.umn.edu)的用户对电影的真实评分。使用这些不同大小的数据集可以很好地测试基于新模型的三种推荐算法分布式实现的实际性能。

3.1 推荐结果比较

为对比不同推荐算法基于新模型的推荐结果,在一个小型HOD集群上进行了验证。实机配置为:Dell Power Edge SC1430,英特尔至强5110(1.6 GHz)CPU两颗(双核),4 GB物理内存,300 GB硬盘(RAID 0模式),都处在100M局域网中。使用3台实机搭建Hadoop集群,三台实机分别作为pbs_server,namenod和datanode节点。在所有的节点上安装Python 2.5.1以及Hadoop发行版本的可执行程序。依次使用Group Lens三个数据集在实验集群上进行测试。

3.1.1 不同推荐算法使用新模型前后的比较

使用Movie Lens 100K数据集,分别运行三种推荐算法的分布式实现,得到使用新模型前后算法的准确率和召回率的对比实验结果,如表1所示。

由表1可以看出,新模型的应用使推荐算法的准确率和召回率都得到了不同程度的提升。所以基于扩展向量的推荐模型可以在一定程度上解决推荐算法在精度方面的问题。另外,三种推荐算法的成功应用也说明了新模型广泛的适用性。

3.1.2 基于新模型的不同推荐算法的比较

为了得到基于新模型的三种推荐算法的对比性能,本实验分别使用Movie Lens 100K和1M数据集来运行三种算法的分布式实现,将得到的关于精准度和运行速度两方面的实验结果直观地呈现在表2~表4和图3,图4中。

ms

通过图3,图4可以得出,基于新模型的ALS推荐算法的准确率最高,基于新模型的Slope One推荐算法的召回率最高,而协同过滤推荐算法在准确率和召回率两方面都处于较低水平。综合考虑准确率和召回率两个方面,可以得出基于新模型的ALS推荐算法的精准度最好,基于新模型的Slope One推荐算法次之。同时,由表4可以得出,协同过滤推荐算法的运行时间最短,与其他两个算法相比,有质的飞跃。

3.1.3 关于冷启动的解决

针对三种推荐算法关于解决冷启动的理论,可以采用Movie Lens 100K数据集对其进行实验验证。针对数据集中有历史评分的项目对象,随机选取20个将其评分数据变为0。运行三种推荐算法,得到对实验对象的预测评分,与原始评分进行对比,得到准确率,实验结果如表5所示。

根据实验结果可以得出,新模型的使用使三种推荐算法都成功地解决了冷启动问题。而且三种推荐算法对基于项目的协同过滤推荐算法的应用最为成功。所以新模型可以在一定程度上解决传统推荐算法的冷启动问题。

3.2 推荐效果综合总结

将推荐结果的评估和算法的复杂度以表格的形式呈现,即可得到如表6所示的内容。

注:▲数量越多,代表在某一方面算法的表现越优。

从表6中可以得出以下结论:协同过滤推荐算法虽然在商业实际应用中较为流行,但是其推荐精度次于其他两种算法;ALS⁃WR推荐算法虽然推荐的精准度较高,但是面向海量数据,其分布式实现中涉及的U和M会非常巨大,运行时要将它们放入内存,极大地影响了程序的运行效率。而且,算法中含有循环,由于Hadoop在处理循环时性能不够好,所以在运行过程中,此算法的性能不如其他两种算法。

Slope One推荐算法的推荐精度、冷启动的解决、运行速度均为三种算法的折中水平,但是其实现原理较为简单,所以实现复杂度较低。三种推荐算法中,基于项目的协同过滤的运行速度最优,从实验结果中可以得出,相对于其他两种算法,它有很大的优势。

4 结论

本文通过对现有个性化推荐算法的研究,提出了基于扩展向量的推荐模型,并基于Mahout中的组件对三种算法进行模型的具体应用和分布式实现,三种算法具体为Slope One推荐算法、ALS推荐算法和基于项目的协同过滤推荐算法。实验结果表明,新模型的应用能显著提高推荐效果,并且解决了推荐算法常有的冷启动问题。

针对云计算环境下大数据的推荐系统,采用分布式文件系统对数据进行存储,从而实现大数据负载均衡存储的功能。另外,分数据数据库的设计中使用地域对其进行数据库分区,此方法间接考虑了地域文化对人的性格和品位的影响,即利用一个地区的人的性格的同一性,间接达到推荐结果更优的效果。针对面向海量数据推荐系统的精确性问题,基于协同过滤算法和Slope One推荐算法,提出了一种新的混合算法,即基于项目的Slope One分布式推荐算法,并将其分布式实现应用于推荐系统中。针对海量数据处理,使用基于Hadoop的云计算平台的同时,针对一些巨大矩阵运算,采用GPU计算框架完成其并行化实现。云计算和GPU技术的融入缓解了面向海量数据推荐系统面临的扩展性和实时性问题。

参考文献

[1]相海泉.迎接大数据时代[J].中国信息界,2013(5):38-42.

[2]赵卫中,马慧芳,傅燕翔,等.基于云计算平台Hadoop的并行kmeans聚类算法设计研究[J].计算机科学,2011,38(10):166-168.

[3]曹润涛.基于Hadoop的移动感知系统的设计与实现[D].西安:西安电子科技大学,2012.

[4]SU H Y,WANG C Q,ZHU Y,et al.Distributed collaborative filtering recommendation model based on expand-vector[C]//Proceedings of 2014 International Conference on Multisensor Fusion and Information Integration for Intelligent Systems.[S.l.]:IEEE,2014,989-994.

[5]朱保华,张晓滨.移动用户餐饮个性化需求推荐研究[J].现代电子技术,2015,38(11):13-15.

[6]任品.基于置信用户偏好模型的电视推荐系统[J].现代电子技术,2014,37(16):30-33.

[7]OWEN S,ANIL R,DUNNING T,et al.Mahout in action[M].US:Manning,2011.

篇4:计算机技术书籍推荐

关键词:云计算;技术;个性化;系统

中图分类号: TP3 文献标识码: A 文章编号: 1673-1069(2016)32-166-2

0 引言

如今,互联网技术的深入发展,开始与各个领域实现有机融合,更多的人开始参与到在线购物、社交网络等网络活动中,网络给人们提供了一个无限的信息资源空间,这个资源库中包含了各式各样的信息,随之发展起来的信息检索技术便捷了人们对信息的搜索需求,搜索引擎成为用户获取信息的主要渠道,但该技术无法为用户提供个性化的兴趣服务,这就需要建立基于云计算的个性化推荐系统,这也是本文所要分析的主要内容。

1 云计算技术与个性化推荐系统概述

1.1 云计算技术

云计算技术依托的是互联网,将互联网的相关服务以动态化、易扩展、虚拟化的资源提供给用户。云计算的定义有很多种,目前较为认可的是云计算技术是根据用户使用量来进行相应交易的计算模式,云计算能够为用户提供便捷、按需的网络访问,进入网络、服务器、应用软件等可配置的计算资源共享区域,这些可以快速提供的资源,无须进行过多的管理,并与服务供应商交互不多[1]。云计算平台所拥有的超强计算能力,可以应用在模拟核爆炸、预测市场发展趋势及气候变化等活动中。

1.2 个性化推荐系统

推荐系统就是结合用户或顾客的购买行为规律以及兴趣特点来推荐相应的信息或商品,使用户满意。现如今,电子商务发展态势迅猛,商品的种类和数量与日俱增,网络信息是冗杂的,用户或顾客需要花费大量的时间找寻目标信息与商品,信息过载问题直接影响了用户或顾客的满意度,导致用户的流失。个性化推荐系统在此形势下应运而生,所谓个性化推荐系统是利用海量数据挖掘技术,通过云计算平台构建的一种高级商务智能平台,主要服务于网站,为用户提供完全个性化的决策支持和信息服务[2]。

2 基于云计算技术的个性化推荐系统分析

2.1 推荐算法与推荐策略

2.1.1 推荐算法

推荐系统利用各个网页间、网页与关键词之间的粗粒度关联和排序,实现为用户推荐相应信息与商品的服务。随着系统的不断发展,其也开始利用网络化计算能力,注重用户兴趣与模型的分析,而个性化推荐系统是在推荐系统的基础上建立的更高级的信息导向系统。个性化推荐系统的构建需要推荐算法的支持,常用的有协同过滤推荐算法、基于内容的推荐算法、关联规则推荐算法、混合推荐算法等。其中协同过滤推荐算法还可以细分,根据不同的算法特征分为基于用户的推荐算法(也叫作基于存储的算法、基于邻居的算法)、基于项目的推荐算法、基于模型的推荐算法等。这些推荐算法都具有自身的优缺点(详见表1),为了弥补各类推荐算法的缺陷,可以将两种互补的算法结合起来[3]。例如基于内容的算法和协同过滤算法这两种算法,我们可以为用户直接展示用不同算法得出的推荐结果集,也可以先用第一种算法得出一种结果集,再用第二种算法计算第一种结果集,进而得到更加精确的结果,更好地满足用户的需求。

2.1.2 推荐策略

以往许多的推荐系统都是结合单一的推荐算法和推荐策略建立的,在使用的过程中逐步暴露除了系统个性化与适应性方面的缺陷,无法结合实际的应用优化推荐策略。因此,在构建个性化推荐系统时要充分结合当下推荐系统的优势以及瞬息万变的市场需求,制定出综合化、系统化、合理化、可行性较高的推荐策略。

前文分析了各类推荐算法的优缺点及应用场景,基于此,本文提出的个性化推荐系统中应用的推荐策略是根据推荐系统数据量的大小制定的,当数据量偏小时系统会采用传统的个性化推荐算法;当数据量偏大时系统会利用云计算平台进行计算,具体就是将数据集发送到云平台的各个节点来实现多节点分布式大规模数据计算。

2.2 系统架构及流程设计

2.2.1 系统架构

云计算技术集成了分布式计算、网格计算、并行计算和网络存储等先进的技术,其有机整合了多个经济性较好的计算实体,逐步形成了具有超强计算能力的分布式系统。为了充分发挥出云计算技术的优势,本文设计的基于Google云计算平台的个性化推荐系统架构如图1所示,该系统能够对大规模数据进行快速、准确地处理,并且可以根据业务规模的不断扩大进行相应的拓展,充分展示了较高的通用性与扩展性[4]。

基于云计算技术的个性化推荐系统主要包括以下几部分:①推荐计算子系统,该子系统由数据预处理模块、数据挖掘模块、推荐模块组成,其中数据预处理模块的功能包括异构数据的过滤、统计、转换等;数据挖掘模块主要是计算推荐结果的聚类,需要充分利用聚类、关联规则算法进行分别计算;推荐模块则是利用各类算法计算出精准的推荐结果,已达到用户的需求。②业务应用子系统,该子系统主要是为后期的系统扩展服务,根据业务需求的变化转变系统的功能,并为系统需求制定合理的推荐规则。③基础云计算平台,其充分利用集群提供的大容量计算能力,在不同节点上进行大量的计算。

2.2.2 个性化推荐系统的操作流程

本系统的推荐流程是依据Map Reduce软件架构,其是处理海量数据的并行编程模式,主要适合应用于大规模数据集的并行运算,其封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供可以把大容量的计算自动并发和分布执行的简单通用接口。具体如图2所示[5]。

3 结束语

综上所述,开发设计基于云计算技术的个性化推荐系统是适应时代发展需求的,其能够更好地满足和引导用户信息需求。本文设计的系统还不完善,还需在以后的运行实践过程中不断的改进。

参 考 文 献

[1] 肖理钏.基于云计算模式的图书文献个性化推荐技术研究[J].科技广场,2015(08):22-27.

[2] 應毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111-117.

[3] 谷瑞.基于云计算的个性化推荐系统的研究[J].苏州市职业大学学报,2013(04):14-16+21.

[4] 朱夏,宋爱波,东方,罗军舟.云计算环境下基于协同过滤的个性化推荐机制[J].计算机研究与发展,2014,10:2255-2269.

篇5:计算机技术书籍推荐

1.全国计算机应用专业人才的需求每年将增加100万人左右 按照人事部的有关统计,中国今后几年内急需人才主要有以下 8大类:以电子技术、生物工程、航天技术、海洋利用、新能源新材料为代表的高新技术人才;信息技术人才;机电一体化专业技术人才;农业科技人才;环境保护技术人才;生物工程研究与开发人才;国际贸易人才;律师人才。教育部、信息产业部、国防科工委、交通部、卫生部目前联合调查的专业领域人才需求状况表明,随着中国软件业规模不断扩大,软件人才结构性矛盾日益显得突出,人才结构呈两头小、中间大的橄榄型,不仅缺乏高层次的系统分析员、项目总设计师,也缺少大量从事基础性开发的人员。按照合理的人才结构比例进行测算,到2005年,中国需要软件高级人才6万人、中级人才28万人、初级人才46万人,再加上企业、社区、机关、学校等领域,初步测算,全国计算机应用专业人才的需求每年将增加100万人左右。2,数控人才需求增加 蓝领层数控技术人才是指承担数控机床具体操作的技术工人,在企业数控技术岗位中占70.2%,是目前需求量最大的数控技术工人;而承担数控编程的工艺人员和数控机床维护、维修人员在企业数控技术岗位中占25%,其中数控编程技术工艺人员占12.6%,数控机床维护维修人员占12.4%,随着企业进口大量的设备,数控人才需求将明显增加。3.软件人才看好 教育部门的统计资料和各地的人才招聘会都传出这样的信息计算机、微电子、通讯等电子信息专业人才需求巨大,毕业生供不应求。从总体上看,电子信息类毕业生的就业行情十分看好,10年内将持续走俏。网络人才逐渐吃香,其中最走俏的是下列3类人才:软件工程师、游戏设计师、网络安全师。4.电信业人才需求持续增长 电信企业对于通信技术人才的需求,尤其是对通信工程、计算机科学与技术、信息工程、电子信息工程等专业毕业生的需求持续增长。随着电信市场的竞争由国内竞争向国际竞争发展并日趋激烈,对人才层次的要求也不断升级,即由本科、专科生向硕士生和博士生发展。市场营销人才也是电信业的需求亮点。随着电信市场由过去的卖方市场转变为现在的买方市场,电信企业开始大举充实营销队伍,既懂技术又懂市场营销的人才将会十分抢手。

篇6:计算机技术书籍推荐

应避开有害气体来源以及存放腐蚀、易燃、易爆物品的地方。

应避开低洼、潮湿的地方。

应避开强振动源和强噪音源。

应避开电磁干扰、电磁辐射。

2.防火措施

应设置火灾报警装置。在机房内、基本工作房间内、活动地板下、吊顶里、主要空调 管道中易燃物附近部位应设置烟、温感受探测器。

应设置卤代烷1211或1301灭火器。

3、计算机机房内部装修

计算机房装修材料应符合TJ16(《建筑设计防火规范》)中规定的难燃材料和非燃材料,应能防潮、吸音、不起尘、抗静电、防辐射等。

计算机机房应装活动地板,活动地板应是难燃材料和非燃材料,应有稳定的抗静电性能和承载能力,同时耐油、耐腐蚀、柔光、不起尘等。

活动地板提供的各种规格的电线、电缆进出口应做得光滑防止损伤电线、电缆。

活动地板下的建筑地面应平整、光洁、防潮、防尘。

安装活动地板时,应采取相应措施,防止地板支脚倾斜、移位、横梁坠落。

4、供配电系统

计算机信息系统应有专用可靠的供电线路,其电源设备应提供可靠的电源,供电电源应满足下列要求(C)类:

频率:50±1HZ

电压:380V/220

变动辐度(%):-15~+10

相数:三相五线制或三相四线制或单相三线制。

波形失真率(%):≤±10

供电电源设备的容量应有一定的余量。

在计算机机房出入口处或值班室,应设置应急电话和应急断电装置。

计算机信息系统的各设备走线不得与空调设备、电源设备的无电磁屏蔽的走线平行。交叉时,应尽量以接近于垂直的角度交叉,并采取防延燃措施。

计算机信息系统接地应采用专用地线。专用地线的引线应和大楼的钢筋网及各种金属管道绝缘。

5.空调系统

计算机房应采用专用空调设备,若与其他系统共用时,应保证空调效果和采取防火措施。

应尽量采用风冷式空调设备、空调设备的室外部分应安装在安全及便于维修的地方。

安装在活动地板上及吊顶上的送、回风口应采用难燃材料或非燃材料。

空调设备中安装的电加热器和电加湿器应有防火护衬,并尽可能使电加热器远离用易燃材 料制成的空气过滤器。

空调设备的管道、消声器、防火阀接头、衬垫以及管道和配管用的隔热材料应采用难燃材料和非燃材料。

6、其它设备和辅助材料

计算机机房使用的磁盘柜、磁带柜、终端点等辅助设备应是难燃材料和非燃材料,应采取防火、防潮、防磁、防静电措施。

计算机机房应尽量不使用地毯。

计算机机房内所使用的纸、磁带和胶卷等易燃物品,应放于金属制的防火柜内。

7、其他保护和安全管理

计算机机房要注意防水,位于用水设备下层的计算机机房,应在吊顶上设防水层,并设漏水检查装置。

计算机机房要注意防静电,采取安全接地(接地是防静电采取的最基本措施)。在易产生静电的地方,可采用静电消除剂和静电消除器。

计算机机房的温度、湿度要求:

温 度(℃):10~35

相对湿度(%):30~80

温度变化率(℃/H):<15(要不凝露)

计算机机房应符合GB157《建筑防雷设计规范》中的防雷措施,在雷电频繁区域,应装设电源避雷器、网络避雷器和通信线路避雷器。

计算机机房内应设置捕鼠或驱鼠装置。在易受鼠害的场所,机房内的电缆和电线上应敷设驱鼠药剂。

计算机机房应装设监控系统,实行24小时值班制度,出入口应安装防盗安全门,窗户应安装金属防护装置。

计算机信息系统应装设容量充足的UPS。

计算机房应装设备用电源和自备发电机。

篇7:计算机技术书籍推荐

一、防火墙是什么

防火墙是一种非常有效的网络安全模型。主要用来保护安全网络免受来自不安全网络的入侵,比如安全网络可能是企业的内部网络,不安全网络是因特网。但防火墙不只是用于因特网,也用于Intranet中的部门网络之间。在逻辑上,防火墙是过滤器 限制器和分析器;在物理上,防火墙的实现有多种方式。通常,防火墙是一组硬件设备-路由器,主计算机,或者是路由器,计算机和配有的软件的网络的组合。不同的防火墙配置的方法也不同,这取决于安全策略,预算以及全面规划等。

二、防火墙的分类

从防火墙的防范方式和侧重点的不同来看,防火墙可以分为很多类型,但是根据防火墙对内外来往数据处理方法,大致可将防火墙分为两大体系:包过滤防火墙和代理防火墙。静态包过滤防火墙:

静态包过滤防火墙采用的是一个都不放过的原则。它会检查所有通过信息包里的IP地址号,端口号及其它的包头信息,并根据系统管理员给定的过滤规则和准备过滤的信息包一一匹配,其中:如果信息包中存在一点与过滤规则不符合,那么这个信息包里所有的信息都会被防火墙屏蔽掉,这个信息包就不会通过防火墙。相反的,如果每条规都和过滤规则相匹配,那么信息包就允许通过。静态包的过滤原理就是:将信息分成若干个小数据片(数据包),确认符合防火墙的包过滤规则后,把这些个小数据片按顺序发送,接收到这些小数据片后再把它们组织成一个完整的信息这个就是包过滤的原理。这种静态包过滤防火墙,对用户是透明的,它不需要用户的用户名和密码就可以登录,它的速度快,也易于维护。但由于用户的使用记录没有记载,如果有不怀好意的人进行攻击的话,我们即不能从访问记录中得到它的攻击记录,也无法得知它的来源。而一个单纯的包过滤的防火墙的防御能力是非常弱的,对于恶意的攻击者来说是攻破它是非常容易的。动态包过滤防火墙:

静态包过滤防火墙的缺点,动态包过滤防火墙都可以避免。它采用的规则是发展为“包状态检测技术”的动态设置包过滤规则。它可以根据需要动态的在过滤原则中增加或更新条目,在这点上静态防火墙是比不上它的,它主要对建立的每一个连接都进行跟踪。在这里我们了解的是代理防火墙。代理服务器型防火墙与包过滤防火墙不同之点在于,它的内外网之间不存在直接的连接,一般由两部分组成:服务器端程序和客户端程序,其中客户端程序通过中间节点与提供服务的服务器连接。代理服务器型防火墙提供了日志和审记服务。

代理(应用层网关)防火墙:

这种防火墙被网络安全专家认为是最安全的防火墙,主要是因为从内部发出的数据包经过这样的防火墙处理后,就像是源于防火墙外部网卡一样,可以达到隐藏内部网结构的作用。由于内外网的计算机对话机会根本没有,从而避免了入侵者使用数据驱动类型的攻击方式入侵内部网。

自适应代理防火墙:

自适应代理技术是商业应用防火墙中实现的一种革命性技术。它结合了代理类型防火墙和包过滤防火墙的优点,即保证了安全性又保持了高速度,同时它的性能也在代理防火墙的十倍以上,在一般的情况下,用户更倾向于这种防火墙。

三、防火墙功能

防火墙是一个保护装置,它是一个或一组网络设备装置。通常是指运行特别编写或更改过操作系统的计算机,它的目的就是保护内部网的访问安全。防火墙可以安装在两个组织结构的内部网与外部的Internet之间,同时在多个组织结构的内部网和Internet之间也会起到同样的保护作用。它主要的保护就是加强外部Internet对内部网的访问控制,它主要任务是允许特别的连接通过,也可以阻止其它不允许的连接。防火墙只是网络安全策略的一部分,它通过少数几个良好的监控位置来进行内部网与Internet的连接。防火墙的核心功能主要是包过滤。其中入侵检测,控管规则过滤,实时监控及电子邮件过滤这些功能都是基于封包过滤技术的。防火墙的主体功能归纳为以下几点:

(1)根据应用程序访问规则可对应用程序联网动作进行过滤。(2)对应用程序访问规则具有自学习功能。(3)可实时监控,监视网络活动。

(4)具有日志,以记录网络访问动作的详细信息。(5)被拦阻时能通过声音或闪烁图标给用户报警提示。

四、防火墙的不足

防火墙对网络的威胁进行极好的防范,但是,它们不是安全解决方按的全部。某些威胁是防火墙力所不及的。

防火墙不能防止内部的攻击,因为它只提供了对网络边缘的防卫。内部人员可能滥用被给予的访问权,从而导致事故。防火墙也不能防止像社会工程攻击——种很常用的入侵手段,就是靠欺骗获得一些可以破坏安全的信息,如网络的口令。另外,一些用来传送数据的电话线很有可能被用来入侵内部网络。

另一个防止的是怀有恶意的代码:病毒和特洛伊木马。虽然现在有些防火墙可以检查病毒和特洛伊木马,但这些防火墙只能阻挡已知的恶意程序,这就可能让新的病毒和木马溜进来。而且,这些恶意程序不仅仅来自网络,也可能来自软盘。

五、常见攻击方式以及应对策略(1)常见攻击方式 病毒

尽管某些防火墙产品提供了在数据包通过时进行病毒扫描的功能,但仍然很难将所有的病毒(或特洛伊木马程序)阻止在网络外面,很容易欺骗用户下载一个程序从而让恶意代码进入内部网。策略:设定安全等级,严格阻止系统在未经安全检测的情况下执行下载程序;或者通过常用的基于主机的安全方法来保护网络。口令字

对口令字的攻击方式有两种:穷举和嗅探。穷举针对来自外部网络的攻击,来猜测防火墙管理的口令字。探针对内部网络的攻击,通过监测网络获取主机给防火墙的口令字。

策略:设计主机与防火墙通过单独接口通信(即专用服务器端口)、采用一次性口令或禁止直接登录防火墙。邮件

来自于邮件的攻击方式越来越突出,在这种攻击中,垃圾邮件制造者将一条消息复制成成千上万份,并按一个巨大的电子邮件地址清单发送这条信息,当不经意打开邮件时,恶意代码即可进入。策略:打开防火墙上的过滤功能,在主机上采取相应阻止措施。IP地址

黑客利用一个类似于内部网络的IP地址,以“逃过”服务器检测,从而进入内部网络达到攻击的目的。

策略:通过打开内核功能,丢弃所有来自网络外部却有内部地址的数据包;同时将特定IP地址与MAC绑定,只有拥有相应MAC地址的用户才能使用被绑定的IP地址进行网络访问。(2)应对策略 方案选择

市场上的防火墙大致有软件防火墙和硬件防火墙两大类。软件防火墙需运行在一台标准的主机设备上,依托网络在操作系统上实现防火墙的各种功能,因此也称“个人”防火墙,其功能有限,基本上能满足单个用户。硬件防火墙是一个把硬件和软件都单独设计,并集成在一起,运行于自己专用的系统平台。由于硬件防火墙集合了软件方面,从功能上更为强大,目前已普遍使用。结构透明

防火墙的透明性是指防火墙对于用户是透明的。以网桥的方式将防火墙接入网络,网络和用户无需做任何设置和改动,也根本意识不到防火墙的存在。然后根据自己企业的网络规模,以及安全策略来选择合适的防火墙的构造结构(可参照本文第3点分析),如果经济实力雄厚的可采用屏蔽子网的拓扑结构。实施措施

好的防火墙产品应向使用者提供完整的安全检查功能,应有完善及时的售后服务。但一个安全的网络仍必须靠使用者的观察与改进,企业要达到真正的安全仍需内部的网络管理者不断记录、追踪、改进,定期对防火墙和相应操作系统用补丁程序进行升级。

七、防火墙的发展历程(1)基于路由器的防火墙

由于多数路由器本身就包含有分组过滤功能,网络访问控制可能通过路由器控制来实现,从而使具有分组过滤功能的路由器成为第一代防火墙产品。

第一代防火墙产品的特点:

1)利用路由器本身对分组的解析,以访问控制表(Access List)方式实现对分组的过滤;

2)过滤判断的依据可以是:地址、端口号及其他网络特征; 3)只有分组过滤的功能,且防火墙与路由器是一体的。这样,对安全要求低的网络可以采用路由器附带防火墙功能的方法,而对安全性要求高的网络则需要单独利用一台路由器作为防火墙。(2)第一代防火墙产品的不足之处 具体表现为:

1)路由协议十分灵活,本身具有安全漏洞,外部网络要探寻内部网络十分容易。

2)路由器上分组过滤规则的设置和配置存在安全隐患。对路由器中过滤规则的设置和配置十分复杂,它涉及到规则的逻辑一致性。作用端口的有效性和规则的正确性,一般的网络系统管理员难于胜任,加之一旦出现新的协议,管理员就得加上更多的规则去限制,这往往会带来很多错误。

3)路由器防火墙的最大隐患是:攻击者可以“假冒”地址。由于信息在网络上是以明文方式传送的,黑客(Hacker)可以在网络上伪造假的路由信息欺骗防火墙。

路由器防火墙的本质缺陷是:由于路由器的主要功能是为网络访问提供动态的、灵活的路由,而防火墙则要对访问行为实施静态的、固定的控制,这是一对难以调和的矛盾,防火墙的规则设置会大大降低路由器的性能。

可以说基于路由器的防火墙技术只是网络安全的一种应急措施,用这种权宜之计去对付黑客的攻击是十分危险的。(4)用户化的防火墙工具套

为了弥补路由器防火墙的不足,很多大型用户纷纷要求以专门开发的防火墙系统来保护自己的网络,从而推动了用户防火墙工具套的出现。 作为第二代防火墙产品,用户化的防火墙工具具有以下特征: 1)将过滤功能从路由器中独立出来,并加上审计和告警功能; 2)针对用户需求,提供模块化的软件包;

3)软件可以通过网络发送,用户可以自己动手构造防火墙; 4)与第一代防火墙相比,安全性提高了,价格也降低了。第二代防火墙产品的缺点

1)无论在实现上还是在维护上都对系统管理员提出了相当复杂的要求,2)配置和维护过程复杂、费时; 3)对用户的技术要求高;

4)全软件实现,使用中出现差错的情况很多。(5)建立在通用操作系统上的防火墙

基于软件的防火墙在销售、使用和维护上的问题迫使防火墙开发商很快推出了建立在通用操 作系统上的商用防火墙产品。系统上的防火墙的特点: 1)是批量上市的专用防火墙产品;

2)包括分组过滤或者借用路由器的分组过滤功能; 3)装有专用的代理系统,监控所有协议的数据和指令; 4)保护用户编程空间和用户可配置内核参数的设置; 5)安全性和速度大大提高。

第三代防火墙有以纯软件实现的,也有以硬件方式实现的,它们已经得到了广大用户的认同。但随着安全需求的变化和使用时间的推延,仍表现出不少问题。(6)操作系统上的防火墙的缺点

1)作为基础的操作系统及其内核往往不为防火墙管理者所知,由于源码的保密,其安全性 无从保证;

2)由于大多数防火墙厂商并非通用操作系统的厂商,通用操作系统厂商不会对操作系统的 安全性负责;

3)从本质上看,第三代防火墙既要防止来自外部网络的攻击,还要防止来自操作系统厂商 的攻击;

4)透明性好,易于使用。

篇8:计算机技术书籍推荐

为了实现网页文档信息的自动采集功能, 本系统将采集模块设置了后台管理参数, 来实现信息的自动“爬虫”功能, 而为了使推荐模块能够基于用户的信息关键词来搜索并提高效率, 就必须实现用户信息的即时搜索和反馈推荐功能。其详细设计如下:

1 系统流程分析

1) 系统业务处理流程:首先, 管理员利用爬虫进行数据的采集, 并将采集到的数据 (博客网页文档) 存储进入本地数据库。采集完成即可对数据库中的文档建立索引。用户登录系统前台输入关键词进行搜索之后, 服务器下达命令于搜索引擎, 进行搜索并且对与关键字相关的数据进行协同过滤, 最后推荐出用户感兴趣的信息, 其处理流程如图1示, 系统业务流程分析图。

2) 系统数据处理流程:管理员登入系统后台爬虫参数设置界面, 设置好采集数据参数, 进而在数据采集页面进行抓取网页文档, 在数据采集完成之对采集到的数据建立索引, 其中包括博文的题目、作者、采集时间等。用户登录系统前台主页, 输入搜索的数据, 即关键词进行搜索, 程序服务器往后台数据库发送命令, 数据库返回协同过滤后的搜索结果给程序服务器, 再完成所搜索到的博文以及其作者的反馈推荐。其处理流程如图2示, 系统数据流程分析图。

2 系统概要设计

1) 系统概念结构设计:概念结构设计就是根据需求分析的结果, 以规定的方法将其转化为一个概念数据模型。而概念数据模型, 是根据系统的需求点来对数据和信息进行建模, 采用E-R关系图来描述。其系统总体E-R图, 如图3示。

2) 系统数据库设计:本系统选用Mysql数据库。从个性化推荐系统的功能需求点出发, 在系统中设计了采集信息配置表 (如图4示) 、信息推荐表等数据库表 (如图5示) , 可以准确有效地存储采集到的数据。

3) 安全性设计:为了系统安全, 采用身份和密码双重登陆验证机制, 来确保系统后台管理只有管理员能够才能够登陆, 进行爬虫参数设置、数据采集、索引建立以及采集信息查看等操作, 保证了系统数据的安全性。

此外, 还加设了数据库的安全工具策略, 如对数据库中表字段或内容的编辑功能等操作, 需要特定的数据库管理工具配合才能进行, 从而进一步提高数据的安全性。

3 系统详细设计

1) 系统功能结构设计:根据系统概要设计, 将本系统分为前台交互和后台数据处理, 由四个模块共同组成:爬虫采集网页文档和信息、lucene索引的创建, 以及操控数据库、搜索主干、前台输入输出处理。各个模块分工协作运行。其系统功能结构如图6示。

本系统管理和界面设计, 包含了前台和后台相联构建的内容, 采用了Eclipse Tomcat服务器和JSP技术。以lucene创建索引, 数据库应用了mysql, 并使用JDBC来实现编程的友好交互, 从而设计出友好的用户界面。此外, 在整个系统的设计上, 采用了B/S三层体系结构 (如图7示) 。管理员使用网页浏览工具向应用服务器发送服务请求, 应用服务器接收请求, 并且执行业务逻辑, 将操作人员想要的信息返回浏览工具显示, 确保整个系统使用过程的开放性与安全性。

本系统中抓取网页文档是系统的信息数据基础, 也是数据的来源, 只有有了丰富的数据源, 才能够提供有效的服务。因此, 本系统测试过程, 主要以新浪博客网页作为数据源, 来抓取其页面的文本, heritrix爬虫具有良好的扩充功能, 可以通过编程进行过滤来抓取另外的文本。通过采集网页的信息, 来对网页中有价值的数据实行提取, 过滤掉那些无作用的数据, 只留下有效性的文本信息, 来提高存储的利用效率, 其数据采集结果主要包括该博客网页文档以及该博客的地址, 博客的题目、内容、作者以及采集的时间等, 如图8数据采集过程图和图9数据采集查看图所示。而搜索推荐主干同样是利用lucene实现, 搜索的关键字在已经创建的索引库中搜查对应的文本。

4 系统实现

基于社会计算的个性化推荐系统使用软件My Eclipse 8.5集成开发实现, 采用JAVA语言来进行开发, 页面采用jsp语言来设计实现, 而数据库则是利用Mysql来实现, 从而实现了根据用户的需求和兴趣为用户推荐出有价值的结果集, 使用户能够在更短的时间获取到自己想要的信息, 其结果转换如图10系统推荐实现图所示。

摘要:基于社会计算的个性化推荐系统是为了实现根据用户的需求和兴趣为用户推荐出有价值的结果集, 使用户能够在更短的时间获取到自己想要的信息。然而, 该系统的数据采集与推荐模块的设计, 直接关系到信息的质量, 该文以新浪博客网页作为数据采集对象, 简述了系统的设计过程, 实现了系统的推荐功能。

关键词:个性化,采集,推荐

参考文献

[1]陈诺言.基于个性化推荐引擎组合的推荐系统的设计与实现[D].广州:华南理工大学, 2012.

[2]梁弼, 王光琼, 邓小青.基于Lucene的全文检索系统模型的研究及应用[J].微型机与应用, 2011 (3) .

[3]冯斌.基于Lucene小型搜索引擎的研究与实现[D].武汉:武汉理工大学, 2008.

上一篇:损害群众利益典型案例剖析下一篇:读《在人间》有感专题