新闻信息分类

2024-06-11

新闻信息分类(精选三篇)

新闻信息分类 篇1

随着互联网的迅速发展, 越来越多的用户从互联网中获取新闻资讯。然而面对海量的网络新闻信息, 用户需花费大量的时间寻找感兴趣的新闻资讯, 此时, 个性化新闻推荐技术应运而生, 它可以从用户的行为中发现用户的兴趣, 为用户推荐个性化的新闻资讯。

用户兴趣建模技术是个性化推荐的基础, 在很大程度上影响着推荐结果的准确性, 因此用户兴趣建模技术成了个性化推荐技术研究的重要内容之一。目前常见的用户兴趣建模方法都将用户的兴趣看作一个整体, 采用统一的方法进行表示和更新。然而由于新闻类别的多样性使得新闻推荐系统中用户的兴趣也具有多样性, 因此将用户的兴趣看做一个整体很难准确地表示用户的兴趣及其变化。因此, 本文提出一种基于分类的用户兴趣模型, 通过AJAX异步方式收集用户的行为数据, 以用户阅读新闻的相对速度度量用户的兴趣, 依据新闻的类别建立基于分类的用户兴趣模型, 并结合基于访问频率的遗忘函数动态地更新模型, 从而更准确地对用户兴趣进行建模。

1. 用户兴趣建模的研究内容

目前, 用户兴趣建模研究主要集中在用户行为数据收集方法、兴趣模型表示方法和兴趣模型更新方法三个方面。

1.1 用户行为数据收集方法

数据收集通常有显式和隐式两种方法。显式收集的方法通常需要用户主动提供表示其兴趣爱好的数据, 其优点是简单、直接, 缺点是要求用户花费一定的时间来参与, 往往会降低用户使用系统的积极性;隐式收集的方法是通过对用户行为跟踪分析来实现, 目前主要有Web日志挖掘方法和AJAX客户端异步收集方法, 主要收集用户访问页面的开始时间和结束时间。隐式收集方法的优点是能够在不影响用户浏览、不增加用户负担的同时, 实时地获取用户行为数据。但隐式收集方式过于复杂, 收集的信息中常包含大量与用户兴趣无关的数据, 从而增加了表示用户兴趣的难度。

1.2 兴趣模型表示方法

常见的用户兴趣表示方法有基于本体论的表示法、评分矩阵法、向量空间模型法以及长短兴趣模型等[1,2,3]。基于本体的方法需要研究人员拥有很丰富的领域知识, 因此这种兴趣表示法不常使用;评分矩阵法的表示方法简单直观, 但是很难随着用户兴趣的变化进行动态调整;采用向量空间模型表示用户兴趣, 能方便地计算用户间的相似度, 是目前应用比较广泛的一种用户兴趣模型;采用长期兴趣模型和短期兴趣模型跟踪用户的长期兴趣和短期兴趣, 并采用层次分类模型表示用户的长期兴趣, 采用近期访问数据缓冲模型表示用户的近期兴趣。也有采用聚类的方法将用户的兴趣分成不同等级, 大的聚类集合表示用户的长期兴趣, 小的聚类集合表示用户的近期兴趣。虽然采用长期、短期兴趣模型分别表示用户长期、短期兴趣的表示法, 需要维护两个用户兴趣模型, 从而消耗一定的系统资源, 但它能及时捕捉到用户兴趣的变化, 提高用户兴趣表示的准确性。

1.3 兴趣模型更新方法

兴趣模型更新方法中, 有的基于用户的访问时间提出了一种反映用户兴趣变化的线性遗忘函数, 降低过时数据的重要性, 同时增大最近访问数据在推荐中的作用, 并通过调节参数值改变遗忘的速度[4];还有的采用遗忘函数法与部分记忆学习相结合的方法更新用户的兴趣, 遗忘函数衰减陈旧数据, 同时部分记忆学习法重新抓取有用的旧数据[5]。

2. 基于分类的用户兴趣模型

由于新闻种类的多样性, 用户一般不可能对所有类别新闻都具有相似的爱好。如果两个用户只在少数几个新闻类别上具有相似的爱好, 而其他类别上却不同, 那么用户间的兴趣相似度将很小, 但是如果按类别计算用户对各类新闻的兴趣相似度, 则可以很好地实现类内的新闻推荐。

基于上述分析, 本文采用基于分类的方法表示用户的兴趣模型, 从而可方便地计算用户在不同新闻类别上的相似度。首先, 根据收集到的用户浏览行为数据计算用户对所有浏览页面的兴趣度;然后, 通过页面属于新闻类别的概率, 计算用户对新闻类别关键词的兴趣度;其次, 基于用户对类别关键词的兴趣度表示用户对新闻分类的兴趣;最后, 将用户对新闻的兴趣进行分类表示, 从而建立基于分类的用户兴趣模型。建立用户兴趣模型的过程如图1所示。

2.1 用户对所有阅读页面的兴趣度

实际生活中, 用户阅读某条新闻表示用户对它有一定的兴趣, 而阅读新闻的时间一定程度上反映用户对该新闻的感兴趣程度, 考虑到用户访问某个页面的时间受新闻文档长度以及阅读速度的影响, 本文采用用户阅读新闻的相对速度rate来度量用户对页面的兴趣度, 兴趣度与阅读新闻的相对速度rate成反比, 用户c对页面j的兴趣度interests可用式 (1) 表示。

式中, ratec, j是用户c阅读新闻j的相对速度, 其计算如式 (2) 所示。

式中, lengthj是新闻j的长度, total Timej是用户c阅读新闻j的时间, rc是用户c访问页面的平均速度, 其计算如式 (3) 所示。

式中, dc是用户c阅读的新闻的集合, lengthi是新闻i的长度, total Timei是用户阅读新闻的时间。

2.2 用户对某类新闻关键词i的兴趣度

依据阅读页面属于某类新闻的概率, 通过用户对所有包含关键词页面的兴趣度,

计算用户对某类新闻关键词的兴趣度。计算如式 (4) 所示。

式中, Rc表示用户c阅读新闻的集合, kej表示页面j属于新闻分类e的概率, interests是用户c对页面j的兴趣度, wij是关键词i在页面j中的重要程度。

用户阅读的包含类别关键词的新闻越多, 对阅读页面的兴趣度越大, 同时页面属于某类新闻的概率越大, 那么用户对某类新闻中关键词的兴趣度将越大。

2.3 用户对新闻分类的兴趣

根据用户对某类新闻关键词的兴趣度, 可表示用户对某类新闻的兴趣, 如式 (5) 所示。

式中, xiec表示用户c对某类新闻e中关键词i的兴趣度, 1

最后, 将用户的兴趣依据新闻的类别进行分类表示, 如式 (6) 所示。

式中, uic (1≤i≤n) 表示用户c在某类新闻i中的兴趣向量, tc表示用户c的兴趣模型建立或更新的时间。

3. 基于访问频率的用户兴趣模型动态更新

1-15天

16-20天

20-30天

教育类

科技类

教育类

科技类

家居类

教育类

人类的记忆会随着时间的推移逐渐被遗忘, 这与用户兴趣变化的过程很相似, 如果用户较长时间不浏览某类新闻, 表示用户对该类新闻的兴趣度降低了, 如果用户经常浏览某类新闻, 表示用户对该类新闻的兴趣度增强了或保持不变[9]。因此, 为了准确地表示用户兴趣, 可使用遗忘函数更新用户兴趣模型。例如, 某用户对科技类新闻很感兴趣, 每天都浏览大量科技类新闻, 而很少浏览体育类新闻, 但奥运会期间他每天浏览很多体育类新闻, 奥运会结束后他对体育类新闻的浏览数量又立即减少。对于这种情况, 如果系统对用户所有兴趣都采用相同的衰减速率, 奥运会结束后较长的一段时间, 系统将继续向该用户推荐体育类新闻, 显然这与用户的兴趣是不相符的。

基于上述分析, 本文对用户不同兴趣度的子类采用不同衰减速率的遗忘函数, 以更好地表示用户兴趣的变化。通常, 用户浏览某类新闻的频率越高, 说明用户对这一类别新闻的兴趣度越大;浏览的频率越小, 说明用户的兴趣度越小。因此, 可用用户访问某类新闻的频率来表示用户不同兴趣度子类的衰减速率。当用户经常访问某一类新闻时, 相应子类的衰减速率会比较小, 当用户访问某一类新闻的频率下降时, 相应子类的衰减速率会增大。

因此, 基于访问频率的遗忘函数定义方法如式 (7) 所示。

式中, fec表示用户c访问e类新闻的频率, Fc表示用户访问所有新闻的频率, 因此, tcur表示系统当前的时间, tc表示用户c的兴趣模型建立或更新的时间。

基于访问频率的遗忘函数表明用户兴趣衰减的速率将随着用户访问频率的增大而减小, 从而, 用户兴趣模型将随着用户访问行为的变化而不断更新。基于遗忘函数更新用户兴趣模型的方法如式 (8) 所示。

式中, uec_old表示用户c在e类新闻中已有的兴趣子向量, uec_new表示基于用户c最新浏览数据建立的兴趣子向量。遗忘函数使用户原有的兴趣值进行一定程度的衰减, 同时将新的兴趣值添加到模型中, 将增强用户对某类新闻的兴趣, 从而实现用户兴趣模型的更新。

4. 实验结果分析

为了验证本文提出的用户兴趣表示和更新方法的有效性, 实验中模拟了某用户的若干浏览行为, 如表1所示。

该用户前15天阅读大量教育类、科技类新闻, 接下来5天阅读大量家居类新闻, 同时保持阅读教育类、科技类新闻, 最后10天只阅读大量教育类新闻。

为了对模型的有效性进行验证, 本实验对表中所示用户的兴趣模型进行为期30天的观察分析, 其中教育、科技及家居三个兴趣子向量中关键词权值的变化情况如图2所示。

由图2可知, 教育类新闻关键词的权值随着用户持续的浏览行为不断增大;科技类新闻关键词的权值前20天一直在增大, 之后, 开始逐渐地减小;而家居类新闻关键词的权值第16天开始大于0, 第21天迅速降低, 5天后便观察不到了;由此可见, 用户兴趣向量中关键词权值的变化与表1中用户的阅读行为是基本一致的, 说明本文提出的基于分类的用户兴趣模型能比较准确地表示用户兴趣。

然后, 对比最后10天内科技类和家居类新闻关键词权值的变化, 可以发现, 访问频率比较高的科技类新闻关键词权值减小的比较慢, 而访问频率比较低的家居类新闻关键词权值减小的比较快;由此可见, 用户兴趣向量中关键词权值的变化情况与本文中定义的用户兴趣衰减速率是基本一致的, 说明本文提出的基于访问频率的兴趣更新方法能比较准确地表示用户兴趣的变化。

5. 结论

本文给出了个性化新闻推荐系统中一种基于分类的用户兴趣建模方法, 实验结果证明该方法能通过用户浏览行为和新闻类别建立基于分类的用户兴趣模型, 并随着用户访问行为的变化而动态更新兴趣模型。

摘要:给了一种基于分类的新闻用户兴趣模型, 通过AJAX异步方式收集用户的行为数据, 以用户阅读新闻的相对速度度量用户的兴趣, 依据新闻的类别建立基于分类的用户兴趣模型, 并结合基于访问频率的遗忘函数动态的更新模型, 从而在个性化新闻推荐中更准确地对用户兴趣进行建模。

关键词:新闻推荐,用户兴趣模型,遗忘函数,动态更新

参考文献

[1]Middleton S E, Shadbolt N R, De Roure D C.Ontologicaluser profiling in recommender systems[J].ACM Transactionson Information Systems (TOIS) , 2004, 22 (1) :54-88.

[2]Miller B N, Albert I, Lam S K, et al.MovieLensunplugged:experiences with an occasionally connectedrecommender system[C]//Proceedings of the 8thinternational conference on Intelligent user interfaces.ACM, 2003.263-266.

[3]Li L, Yang Z, Wang B, et al.Dynamic adaptationstrategies for long-term and short-term user profile topersonalize search[M]//Advances in Data and WebManagement.Springer Berlin Heidelberg, 2007.228-240.

[4]Kim H R, Chan P K.Learning implicit user interesthierarchy for context in personalization[C]//Proceedings ofthe 8th international conference on Intelligent user interfaces.ACM, 2003.101-108.

分类新闻308 篇2

活动类新闻

活动类新闻比较贴近学生生活,需要写得引人入胜,抓住读者的心。不是每件事都按固定的轨迹走的,不能单单记录活动流程,要把活动写“活”,捕捉精彩瞬间。

一、社会实践类

1、参观九·一八纪念馆(雷锋 纪念馆、历史博物馆等)

(1)开头:x月x日,„„(人物)去„„(地点)进行参观(学习),本次参观旨在„„

(2)正文:参观流程。着重写参观中印象深刻、给人以教育意义的地方。

(3)结尾:参观后一些活动(例如:之后又去参观什么活举行了什么活动,回来后召开总结大会,简单提)

2、参观企业(企业简介)

3、志愿者(老年中心、红十字会、爱心活动、拍卖会、慰问演出等)

(1)开头:时间,地点,参加人员,背景(可放在结尾)

(2)正文:活动内容,着重写精彩的部分注意细节

(3)结尾: 同学们纷纷表示·······

5、模拟招聘等(创业就业大赛)

二、文艺类

1、毕业生晚会(元旦、迎新晚会)

(1)开头:在······之际,时间,事件,地点,参加人员,背景(可放在结尾)

(2)正文:活动内容,着重写精彩的部分注意细节

(3)结尾:学生反响

2、歌曲大赛(舞蹈大赛、小品大赛、短剧大赛、乐器大赛)可在正文部分简单说明获奖情况

三、体育类

1、足球赛、排球赛、篮球赛„„

(1)开头:时间主办单位参赛队伍或人员背景

(2)正文:简要叙述比赛过程(切忌写没用的废话),强调比赛中精彩瞬间,感人事迹

(3)结尾:比赛胜负,参赛人员及观众反响

2、一二九长跑(政治色彩)

要开拓视野,了解背后的故事。此类还有五四青年节,建国六十年等 在······之际,(同上)

四、知识类

1、辩论赛(后附例文)

两类:单场辩论

站在主办方的角度写整个辩论赛情况

2、征文比赛(书画展、动植物标本展)

(1)开头:在···之际,时间由谁举办的···展在···举行,该展览,由谁主办

由谁举办的·····展于X月X日在······举行,本次展览旨在······

(2)正文:简介参展作品概况(作品简介,作品主题,作品内容,作品类型),强调重要作品。

3、各院特色知识竞赛

(1)食品知识大赛

(2)水知识大赛(南方杯测量大赛)

(3)环保知识大赛

(4)电子设计大赛(电脑知识、计算机应用)

比赛类文章写法:先流程后结果

如果是写“········活动比赛仪式落下帷幕” 则第一段最

好先交待比赛结果,再简单回顾流程。

会议类新闻

会议类新闻需要写作者的敏感性,要善于触摸到别人没发现的东西,同一件事,可以有不同的报道侧面。如陈温福当选院士庆祝大会,通常写法就是按流程分别罗列各领导讲话,但这样是千篇一律的形式,不吸引人。可以抓住陈院士讲话内容(感谢恩师,感谢团队等)重点写,表现陈院士人格魅力。也可写沈阳副市长拨款500万,体现政府支持。这样就显得更有高度。

一、工作会议

1、励志教育

2、学风建设

3、家庭经济困难学生管理

4、座谈会开头·······

这类新闻属于学校传统类型的工作,必须明确学校的精神,政策。

题目:要有一定高度若是系列活动要写“大主题”,不要只写小活动主题 正文:简介谁谁传达了什么文件就····展开讨论会议内容重要领导讲话

学生会议加入学生参与过程。

结尾背景近年来(后附例文经管学风建设)

二、培训会

1、学习经验交流会

2、专业介绍会

3、干部培训大会

4、党员培训大会

4、计算机技能培训(各种技能培训)(后例文家教培训)

主要写培训内容:几个人讲话可并列写

一个人讲话分为几个方面或几个要点

结尾讲述会议影响背景作用效果不要主观评论

三、讲座类(企业经理、专家、教授消防(寝室安全))

题目:如果是请知名人士来讲座,题目直接体现(特殊的人,特殊的事要特殊说。隔壁的老太太吃饭和温总理在救灾前线吃馒头就咸菜是不一样的)

开头:交代时间地点后,先写我校出席领导,然后嘉宾

正文:加入讲座人的简介(但必须简略)

写讲座内容时要体现讲座人的特色(例文闻邦椿两篇)

四、表彰大会

谁受到表彰重要人物讲话一个人的讲话的重点内容

结尾 会议最后谁强调(后附例文)

近日,从„„传来喜讯,结尾:介绍背景(不要写别的学校获奖情况)

五、启动仪式

(1)开头:时间主办单位在······启动了······项目,该项目旨在······

······项目X月X日在······启动

(2)正文:简介项目背景人员目的内容

简介流程(预赛、决赛、表奖方式)

六、系列活动 写大主题

垃圾分类新闻稿 篇3

1、垃圾分类进校园——垃圾分类宣传

在11月底的一次升旗仪式上,队员们就聆听了一次关于垃圾分类的主题发言,裘菁老师向全校师生宣讲了垃圾分类的意义,并介绍了垃圾分类的方法,少先队员代表也进行了国旗下讲话,积极践行垃圾分类,打造更加美好的生活环境。各中队也布置了一期以“垃圾分类从我做起”为主题的黑板报,校团队宣传栏中也对垃圾分类进行了介绍、倡议。12月的月底前,我校也完成了垃圾桶设置,根据实际开展垃圾分类,在教师食堂设置了两个垃圾桶,即干垃圾桶和湿垃圾桶。建立了垃圾分类区域,设置可回收垃圾桶,干垃圾桶和有害垃圾桶。

通过海报宣传,引导大家熟悉“四分类”标准,让大家从身边做起、从点滴做起,养成主动分类、自觉投放的行为习惯,形成垃圾分类“人人有责、人人尽力、人人作为”的良好氛围。通过教室黑板报、团队宣传栏布置,向队员们宣传垃圾分类的必要性、重要性,宣传垃圾分类的方式方法,倡议队员们主动进行垃圾分类,互相提醒垃圾分类。

2、垃圾分类进课堂——新年第一课

在队会课时间,各中队播放乐区级统一配送的垃圾分类视频课,队员们认真观看,时不时做一些笔记。通过观看视频,队员们更进一步了解了垃圾分类的重要意义,学习乐垃圾分类的相关知识。

3、垃圾分类进社区——新年打卡周

在元旦前夕,下发了《垃圾分类活动实践卡》。队员们以“大手牵小手”的形式,每天和家长一起在家庭及社区完成一次垃圾分类投放活动,并认真填写了《垃圾分获活动记录卡》。

上一篇:特别的新年礼物下一篇:鉴别诊断胸腔积液