文本方式

2024-08-05

文本方式(精选八篇)

文本方式 篇1

一、在对比排列中品析词句

“在艺术作品里, 只有在这样的情况下, 既不能加一个字, 也不能减一个字, 还不能因改动一个字而使作品遭到损坏的情况下, 思想才算表达出来。”作家们“为求一字稳, 不厌五更迟”, 对于写作可谓呕心沥血, “语不惊人死不休”。所以, 教学中只有悉心推敲、比较、品味作家们遣词造句、表情达意的精妙之处, 才能让学生领略祖国语言文字的无穷魅力。

人教版三年级上册第18课《盘古开天地》有这样一句话:“轻而清的东西, 缓缓上升, 变成了天;重而浊的东西, 慢慢下降, 变成了地。”课文在这段话的边上, 还印有一个学习提示:我发现这一段有不少意思相反的词。我们通常会要求学生先圈出句中的反义词, 再让学生进行朗读, 体会句中反义词使用得准确生动。整个教学过程感觉是教师牵着学生走, 完全背离了课程标准所倡导的“语文课程必须根据学生身心发展和语文学习的特点, 爱护学生的好奇心、求知欲, 鼓励自主阅读、自由表达, 充分激发他们的问题意识和进取精神, 关注个体差异和不同的学习需求, 积极倡导自主、合作、探究的学习方式”。

笔者在教学中利用课件这样出示句子:

轻而清的东西, 缓缓上升, 变成了天;

重而浊的东西, 慢慢下降, 变成了地。

请学生自由朗读。

师:你有什么发现?

生1:我发现句子里有一对反义词是“轻”和“重”。

生2:老师, 除了“轻”和“重”以外, 还有两对反义词, “清——浊”、“天——地”。

师:嗯, 小眼睛真会发现, 来, 让我们再来读读这句话, 边读边思考:这句话中除了藏着反义词, 你还能发现什么?

齐读。

生3:我觉得这句话里还有一组意思相近的词——“缓缓”和“慢慢”。

师:你们真了不起, 不仅发现了句子中三组反义词, 还找到一组近义词, 谁能把对这些词语的理解读出来?

学生练习朗读, 指名读。

师:这么好的句子, 我建议小朋友把他积累下来, 好吗?

学生练习背诵。

原本艰深的句子理解, 在对比排列句子后, 变得简单而有趣, 也不用教师再逐字分析“轻而清”、“重而浊”的具体意思, 通过朗读, 学生自然而然地把文本理解转化成了朗读语调上的轻重缓急。学生在学习过程中体验“发现”的快乐和兴奋, 感受祖国语言文字的神奇、有趣, 通过近义词和反义词的理解, 背诵起来也事半功倍, 这不正是我们追求的“自主、探究”的语文学习吗?

二、在诗化排列中感受韵味

小学语文教材中不乏文质兼美的典范之作, 有其独特的韵味。教师应利用朗读、理解、感悟、影像、想象等多种形式发掘和利用课文中的美, 收到以美激趣、以美育德、以美启智的教学效果。和声、光、电立体式的阅读环境相比较, 把文章以诗歌的形式呈现最为简单和纯粹。

诗化课文对于母语及优秀的民族人文思想感情的传承、发扬有着重要的价值。不可否认, 我国的诗歌蕴含着强大的民族人文内涵, 开发语文课本中的诗意资源, 有利于诗教的传承与发扬。诗化课文, 对课文中的精美词句进行个性化的积累、运用、再创造, 找到一个高雅的运作平台。因为在诗化课文的过程中, 对课文“语珠”也进行了多次淬炼, 使得这些原本经典的词句, 更易于记忆, 更易于激活, 增加了词句的生命张力, 从而使得这些承载着民族人文因子的词句, 深深地融入到孩子们的思想中。

如人教版四年级上册《搭石》一文中“每当上工、下工……”这句话, 我们可以用诗歌的形式重新排列:

每当上工、下工,

一行人走搭石的时候,

动作是那么协调有序!

前面的——

抬起脚来,

后面的——

紧跟上去,

踏踏的声音,

像轻快的音乐,

清波漾漾, 人影绰绰,

给人画一般的美感。

这样的呈现形式, 让文本的节奏美跃然纸上, 看着这样诗化的文本进行理解和朗读“协调有序”、“画一般”的美感, 学生不再感觉是咬文嚼字, 朗读不再是机械重复, 课文质朴的语言与秀美的意境“协调有序”地融合在一起, 化作诗一样的语言在课堂上品读。

三、在表格排列中进行仿写

冰心在《谈点读书写作的甘苦》中说:“我常常抄袭, 就是说模仿别人更好的句子。”

如在教学人教版三年级上册的《花钟》时, 笔者出示:

学生根据表格在教师的指导下完成学习任务:

(1) 自读课文, 填写表格;

(2) 体会作者用词的丰富;

(3) 利用表格背诵;

(4) 仿写:蛇麻花在凌晨三点左右;______清晨四点, 羊须草_________;清晨六点左右龙葵花;蒲公英则在早晨七点左右________;到了中午十二点, 太阳花________;下午五点多, 紫茉莉__________;月亮升上了天空, 晚香玉________。

把文本变成表格的方式排列, 让学生快速筛选信息, 在短时间内对花开时间、花开样子有了一个整体的感知, 有效地引领学生感受文章丰富的用词, 并利用表格进行背诵、仿写。带着这份表格进行阅读学习, 既能锻炼学生的思维, 提高学生概括、分析的能力, 又能有效地引领学生深入文本, 更好地理解文本特点, 可谓一举多得。

探析揭示文本情感的有效方式 篇2

一、以读促感,感受教材的情感

教学当中的“情”犹如教与学双边活动的催化剂,有了它,学生就会在教师的点拨下较易进入课文佳境。在阅读教学中,可以通过朗读来品味、感受、体验教材的情感,使学生的情感与作者的情感产生共鸣,提高学生把握作者情感的能力。我们来看这么一个片段——

师:怎样的动作才是协调有序的呢?

生:就是很有顺序,配合得很好。

师:这是从字面上理解。

生:就是“前面的抬起脚来,后面的紧跟上去,踏踏的声音,像轻快的音乐”。

师:你联系下文理解了。让我们加入到走搭石的人群中(指一组学生:前面的……后面的……前面的……后面的……)咱们合作着读一读。

师:你们现在走在哪?

生:搭石上。

师:不好走啊,走得不好要掉进水里,有信心吗?

生:有。

师(引读):每当上工、下工,一行人走搭石的时候,动作是那么协调有序!前面的——

生:抬起脚来。

师:后面的——

生:紧跟上去。

(速度渐快,引读三遍)

师:没有人踩脚,没有人跌入水中,该是有人指挥吧?(生摇头。)对,其实没有人指挥。那么默契,那么有序,这样的动作就叫做——

生:协调有序。

《搭石》语言质朴,意境优美,体现了景美、人美、情美的情感。走搭石是体现人美、情美的关键环节。在这个教学片段中,教师引导学生品读“协调有序”,用语言创境,在我们面前展现出走搭石时亮丽的风景,让人身心愉悦。

二、以写促悟,升华教材的情感

在阅读教学中,教师凭借教材,让学生在领悟思想感情的基础上,倾吐自己内心的感受。这样能让学生以课文内容为素材,在理解课文语言的基础上加以运用,使学生有感而发,有情可抒,有话想写,用自己的心灵去书写。

某教师在教学《卖火柴的小女孩》时,在学生已经理解了小女孩“没卖掉一根火柴”的有关词句基础上,让学生对小女孩在“大年夜”卖火柴的“可怜”情景展开想象,并动笔写下来。时间只用了5分钟,学生却能在对教材产生的强烈共鸣后,写出了很多的精彩内容。

生1:小女孩跪着:“卖火柴,谁来买我的火柴?”她不断地拉着路人的衣服,可他们无情地将小女孩推开了,火柴洒了满地。小女孩趴在地上,一根根地捡着,捡起一根,另一根却被人踩了,她无助地捡着、捡着……(此刻,教室里安静极了,泪花闪在同学们的眼中,教室弥漫着悲愤的情绪…… 终于,一个学生发了声轻轻的感叹:“写得太好了。”)

生2:她在街上一边走一边喊:“卖火柴……”她对一个绅士说:“先生,请买一盒火柴吧,才一个钱。”绅士说:“那好吧。”那位绅士正要掏钱时,她的太太过来说:“别买!这种火柴质量不好,要买去专卖店买。”说完,转向小女孩怒声喝道:“快滚!”小女孩只好快步跑开,要不然她会被那太太打的。她无助地在大街上喊着:“卖火柴,谁买我的火柴……”

……

前苏联教育家赞可夫曾经说过:“教学一旦触及学生的情感和意志领域,触及学生的精神需要,便能发挥其高度有效的作用。”在以上课例中,学生用自己的心灵书写着对教材的感悟,在感悟过程中一次次地拨动着自己的心弦,深入品析、感受教材内涵的美。

评点是与文本对话的有效方式 篇3

评点法是中国传统的阅读鉴赏法。古人云:“读文无批注, 即偶能窥其微妙, 日后终至茫然, 故评注不可已也。”如脂砚斋批注《红梦楼》, 金圣叹批注《水浒传》, 毛宗岗批注《三国演义》等, 其中很多批注评点切中肯綮, 见解独到, 具有很高的学术价值。但古人的评点属于层次较高的文艺批评范畴, 我们所谓的“评点”, 则人人皆可为之, 人人皆应为之。“评”是指对课文内容和写法作简明扼要的评议赏析;“点”是指圈点勾画;“评点”就是指在阅读的基础上, 对文本中的关键语句、精彩片断、语言特点、艺术手法、思想内容、层次结构等有独特的体验之处、佳妙之处进行圈点勾画, 进行画龙点睛式的点解。其做法一般是在字、词、句间作点, 在层次段落间作评, 边读边点, 逐段加评, 品评文章思想内容或词句、篇章、写作方法的优缺点, 点评、解释名物典故, 简明扼要地指出文章思想和表达形式的要点和特色。评点法一般是要言不烦, 一语中的;还可以设置疑问, 引导学生深入思考并发表个人见解。

评点法作为一种有效的学生与文本对话的方式, 苏教版高中语文必修一“月是故乡明”专题第一板块“漂泊的旅人”三篇文章皆以样板的评点, 作了示范:在阅读鉴赏过程中与文本、编者对话, 思之所至, 由感而发, 信手拈来, 把对文本言语形式之美的品评、揣摩等林林总总的阅读所得、所感、所疑用简明扼要的语句记录在 (评点) 在书眉页侧, 与正文相映成趣。评点随文本生成, 这种评点法, 体现了“在只言片语中立论”的中国思想文化特色。

归纳起来, 评点法有三点好处。

⑴评点法符合语文新课改的精神。阅读教学是学生、教师、教材编者与文本之间的多重“平等对话”, 是思想碰撞和心灵交流的动态过程, 而“评点法”注重个性化阅读, 能充分调动学生自身的生活经验和知识积累, 从不同角度和层面对文本进行“多元解读”。

⑵评点法是激活语文课堂教学的有效途径, 也是真正体现以学生为主体, 以文本为依据, 张扬学生个性化阅读的重要方法。评点法讲究的是过程体验、对话交流, 不仅有利于加深学生对文本的理解, 提高学生的语文素养, 而且能够使他们养成独立思考、主动探究的习惯, 从而克服语文教学中长期存在的被动收听的毛病。

⑶评点法有利于学生在自主阅读中掌握整体阅读规律。学生可以根据自己的认识能力, 语言能力, 阅读经验, 应用略读, 精读等多种阅读方式, 从整体阅读中, 把握文章的基本内容, 从整体内容系统中去分析文章局部。

合理、有效地使用评点法, 要注意五个问题。

1. 评点要以文本的整体把握、理解为基础。

这里的整体把握, 既包括对选文的把握, 也包括对本专题的整体性感知。评点要有一个笼罩全文甚至全专题的统领性思想, 才能保证评点时不至于在某些枝节问题上旁逸斜出, 偏离文旨。

实际上, 在阅读中, 作品的局部与整体是不可分割的, 因为对局部的理解是建立在整体理解的基础上的, 局部只有在整体中才能理解, 整体是局部的语言环境。

比如《月是故乡明》这篇课文, 评点时如果学生对课文定位不准, 很可能对文中有关月亮的描写, 大感兴趣, 于是就把理解的重心转移到古今中外对月亮的诗文中去了。若就单篇来看, 这样的引申和拓展也未尝不可, 但是就文本的文旨和本专题的人文话题来看, “思乡”、“归乡”才是正题, 月亮只不过是作者借助的一个抒情意象, 就像《想北平》中老舍借助北平那“长着红酸枣的老城墙”、那“温和的香片茶”、“带着霜的玉李”等等这些带着乡土味儿的旧物, 来寄托自己的思家之情一样, 如果学生把兴趣的重心移至老北京的民俗风土上, 热热闹闹地评点起自己的家乡特产来, 那自然是完全脱离了专题的人文话题了。

2. 大处着眼, 小处落笔。

评点, 主要在一个“点”上, 即宏观考虑, 细处下手。评点常在细微处感受和发现, 评点的对象常在于语句, 甚至个别词语。有时, 一些看上去是局部的地方实际上关系到作品的内涵, 是理解作品整体的关键。如所谓“文眼”, 就关系到全篇的结构, 有的关系到全篇的主旨、感情的转换, 甚至是给全篇写作方法和风格定调子的地方, 在评点时就要在整体把握的基础上评点局部。

如学习刘亮程的散文, 他的散文中一向充斥对生命的关注, 而这种生命意识在文中表现得很具体, 具有日常生活化, 作者对它们的书写是细致入微的, 有着太多的细节。这样的散文在评点时就需要小处落笔, 大处着眼。如刘亮程《今生今世的证据》:

我走的时候, 我还不懂得怜惜曾经拥有的事物, 我们随便把一堵院墙推倒, 砍掉那些树, 拆毁圈棚和炉灶, 我们想它没用处了。———评点:许多事理总是要经过人生历练和心灵思考才会明白, 等到明白时, 时间的流水已经带走了许多的东西, 所以人生常有遗憾。

我走的时候, 我还不知道曾经的生活有一天, 会需要证明。———评点:人活在世界上是需要对象来证明自己的。证明来自于他人, 来自自己生活的地方, 来自于自己的劳动成果, 这些都是人生命的痕迹。

3. 评点的重点多在内容上, 但表现内容的形式 (技法, 手法, 修辞等语言的表现形式) 也不应忽视。

文章的美、文学的魅力与其表现内容的形式是密切相关的。恰当的表现内容的形式可以突出文章的主题, 从而使文章表情达意更为深刻, 增强文章的表现力。评点这些表现内容的形式, 一方面可以帮助我们认识这些艺术表现形式的巨大作用, 另一方面可以提高我们的写作能力。

如从修辞手法入手。常用的修辞手法有比喻、比拟、夸张、借代、设问、反问、反语、双关等, 这些修辞的使用为文章添色不少, 因而可以通过作者所选用的修辞手法来理解文句用意。如:对吊灯作第六次或六十次研究。 (韩少功《我心归去》) ———评点:细节描写“见微知著”。运用夸张更形象表明作者在异乡的孤独无聊。无聊至极的举动, 写出了作者无所事事的要发疯的感觉。

如从文章结构入手。有的文章开门见山, 有的文章却曲径通幽;有的文章开头和结尾各具特色, 有的文章结构严密、完整匀称, 有的文章烘托铺垫、前后照应, 有的文章设置悬念、制造波澜、曲折有致。例如:我在圣·纳塞尔市为时一个月的“家”, 是一幢雅静的别墅。两层楼的六间房子四张床三个厕所全属于我, 怎么也用不过来。房子前面是蓝海, 旁边上公园。很少看见人———除了偶尔隔着玻璃窗向我叽里哇啦说些法语的公园游客。 (韩少功《我心归去》) ———评点:描写物质环境的优裕, 为下文做铺垫。

4. 评点要能调动学生的感性经验。

不容否认, 高中语文有效教学的过程是在教师引导下, 调动学生认知结构中的感性经验和知识去感知、理解文本, 经过思维加工, 产生认识飞跃, 最后组织成完整的文本理解的过程。这个过程, 强调了学生感性经验的参与。但高中语文教材中有些文本涉及的文旨或情感在一定程度上超越了学生的感性经验, 这就需要调动学生的感性经验。如苏教版必修一“月是故乡明”这个专题。

很多教师反映“月是故乡明”这个专题不好教, 因为很多学生根本没有长期生活在外地的经验, 哪里来的“思乡之情”?哪有什么痛苦可言?但如果我们能引导学生更深层次地解读选文的话, 就会让学生明白:作者思念的这个“家”, 不是“那个可遮风避雨的实在的”具象的家 (曹文轩《前方》) , 作者思念的这个“故乡”“意味着我们的付出———它与出生地不是一回事” (韩少功《我心归去》) , 它不是让我们遮身避体的物质家园, 而是我们所有人让心灵有所归宿的精神家园。

在家的人, 有克制不住的离家的愿望, 因为人会在闯荡世界之中获得生命的快感和满足按捺不住的虚荣心;而离家的人呢, 即使身在法国一幢雅静的别墅里, 也还是要吟唱“我心归去”。从这个意义上来说, 无论是在家的人还是出门的人, 只要他的心不属于他身体的所在地, 他就是精神上的“飘泊者”, 而这些“漂泊者”的“收容所”, 就是他们所要找寻的精神家园。

学生今天坐在课堂上, 努力学习, 不就为了有朝一日能找寻到真正属于自己的那方精神热土吗?他们真正挥洒热血和激情的地方, 不是今天身在的教室, 而是明日彼岸的那片精神家园啊。学生们的自身体验中肯定不乏身在此岸、心在彼岸的经历, 所以, 教师引导好了, 学生还是很能够和作者产生“月是故乡明”的共鸣的。写下这样的共鸣, 不就是另一种形式的评点吗?

5. 评点应倡导反面质疑。

北宋哲学家张载说:“在可疑而不疑者, 不曾学;学则须疑。”质疑是提高阅读质量的重要途径。善于发现问题, 敢于质疑问难是学生自主学习与主动探究知识的生动表现。学生在学习过程中大胆地提出问题就是迈开了创新思维的第一步。学生在积极思维、质疑、解疑的过程中, 就已突破了思维的惰性, 发展了求异思维和创新思维, 为提高创造力奠定了基础。

如《记念刘和珍君》第七部分第一段:“我向来是不惮以最坏的恶意来推测中国人的。但这回却很有几点出于我的意外。一是当局者竟会这样地凶残, 一是流言家竟至如此之下劣, 一是中国的女性临难竟能如是之从容。”———评点:三个“一是”不能统一到整个的一句中。前两个“一是”是一层意思, 就是“当局者”与“流言家”坏到“出于我的意外”;第三个“一是”是对中国女性的赞扬。从结构上说, 这段话承上启下, 据前后内容, 应写成:“……一是当局者竟会这样地凶残, 一是流言家竟至如此之下劣。然而使我欣慰的是, 中国的女性临难竟能如是之从容, 这也出于我的意外。”

正如德国阐释学理论家伽达·默尔强调:艺术存在于读者与文本的“对话”之中, 作品的意义是在读者与文本的“对话”中生成的;而且作品的意义并非取决于一次对话, 而是取决于无限的对话;艺术是开放的, 随着不同读者参与对话, 同一部文本会生出无数不同的第二文本。

评点法, 一种与文本对话的有效阅读方式。

探索童话类文本解读的有效方式 篇4

一、解读关键词,领悟作者意图

《全日制义务教育语文课程标准》第二学段提出了“能联系上下文,理解词句的意思,体会课文中关键词句表达情意的作用”的要求。怎样找准关键词句?怎样体悟关键词句表达情意的作用?那就是要练就一双慧眼,一下子瞅准文本中的关键词,抓住它引导学生步步深入地感悟文本。

王崧舟在解读童话故事《去年的树》时,抓住能体现主旨的关键词“天天”进行深度咀嚼,让学生从朴实的文字中读懂作者的真实意图,领悟文字背后深刻的内涵。

课伊始,以“鸟儿站在树枝上,天天给树唱歌”為母体,预设各种特定的场景,让学生展开想象的翅膀:当太阳升起时,当月亮挂上树梢时,当冰雪融化时,当树叶在秋风中飘落时……鸟儿站在树枝上,天天给树唱歌的情景。如此顺势拓展,使课文中原本单一的场景,因预设的种种场景而更加丰富多彩,同时强化了“天天”的意义。通过创设美好的情境,品读“天天”,让学生体会鸟儿和树之间深厚的感情。当鸟儿再也看不到树时,教师再次采用创设情境的方式品读结尾,引导学生体会昔日鸟儿和树的深厚情感。鸟儿对过去的一切记忆犹新,可惜树已不在,让学生在思考和感受中深刻体悟鸟儿和树永恒的友谊。

二、解读提示语,感受留白魅力

大部分童话故事,都会恰当地运用提示语来表达人物的情感变化,推动故事情节的发展,使人物形象更加鲜明、生动、各具特色。阅读童话故事时,借助提示语可以更好地走进作者的心灵深处。在《去年的树》这个童话故事中,作者一反常态,不写鸟儿和树的外貌、表情、心理,难道作者不明白提示语的好处吗?

王老师敏锐地捕捉住了这一独到之处,教学时,先让学生把关于人物心情、表情的提示语加上,然后师生合作读,老师读添加后的提示语,学生读鸟儿的话,读出提示语的味道。当树提出约定,她是如此的——爽快;当鸟儿飞回来,却不见大树时,她是如此的——迫不及待;当她得知树被拉到工厂时,她是如此的——惶惶不安;当大门告诉她树被机器切成细条儿,做成火柴时,她是如此的——心如刀绞,鸟儿对大树的感情是如此——深厚。最后,他智慧地点拨学生,加上提示语虽然能读出童话的味道,能帮助大家更直接地体验到鸟儿与树这种感情的唯一、友情的珍贵,但束缚了众人的想象力。作者不写外貌,不写表情,不写心理,不是作者不会,而是用这样浅近的描写,留给了我们无尽的想象。因为这留白,带给了我们这么美的感受,带给了我们这么耐人寻味的童话故事。

三、解读拓展点,激发奇特想象

童话故事有着奇妙丰富的想象,怎样合理地解读文本,让学生从中获得神奇的想象力。找准故事中的拓展点,精心设计一两个有趣的话题,让学生练习写话,可以很好地发散学生的思维,培养想象力。

王老师教学《去年的树》时,设计了一个别具匠心的话题让学生练笔。他深情地问:“孩子们,读着读着,你的眼前仿佛出现了一棵怎样的树,出现了一只怎样的鸟儿呢?展开想象,写一写你脑海中浮现的树的模样,鸟儿的外貌,并用上‘特别’这个词语。”一生这样写道:“树长得特别茂盛,郁郁葱葱的,引人注目。鸟儿呢,长得特别小巧玲珑——像个小天使。”学生交流后,王老师要求大家借鉴这个同学的写法,试着修改一下自己写的树和鸟的外貌,先写“特别怎么样”,然后具体地写“怎么样”。最后总结:孩子们,森林里有千万棵树,而我们的鸟儿只为这一棵树唱歌,他长得特别——茂盛。森林里有千万只鸟,而我们的树只喜欢听这一只鸟儿为他唱歌,她长得特别——小巧玲珑。在千万棵树中遇见这样一棵树,在千万只鸟儿中遇见这样一只鸟儿,这是一段多么深的缘分哪!

王老师基于儿童,基于童话的角度深层次解读童话类文本,不仅关注了学生的现实“高度”,还关注了学生可能生长的“高度”,让学生在童话王国里像春日的竹子一样拔节长高。

文本方式 篇5

一、自主预习

“学讲方式”要想处理好,就要处理好学生的自主预习环节。一直以来,语文教师不注重学生的自主学习,认为语文学科预习不重要或者根本就没有必要预习,即使有的教师布置学生预习了,也没有明确的预习任务。如果能够制定一个预习的方案,再辅之以教师课堂的指导和检查,效果会明显提升,而且更为关键的是学生养成了自主学习的习惯,增强了对自我的认知。以《莫高窟》为例,教师可以制作一个自主学习的导学案,除了最基本的掌握生字的读音和朗读流畅之外,还要让学生解决重要词语的意思。例如,“蜂窝”“神态各异”“惟妙惟肖”“精妙绝伦”“宏伟瑰丽”等词汇的含义的准确掌握,对于理解文章内容非常重要。教师还要布置学生到网上查阅一下关于《莫高窟》的资料,进一步地进行全面了解。这些事情是学生完全可以独立自主完成的,学生课前解决了这些内容,不但节省了课堂时间,提高了课堂容量和效率,而且培养了学生自己解决问题的习惯。

二、参与课堂

“学讲方式”的关键环节是人人参与课堂,教师要注意调节好学生参与的时间,让学生人人有任务,都能感觉到参与的责任感、愉悦感。“学讲方式”这种课堂模式,很容易变成优等生的“一言堂”,因为大多数的问题优等生都可以思考出来,而且这类学生的语言表达能力也好,也更愿意表现自己,让每一个学生都有参与讨论的机会。教师首先要在规则制度上保证或者督促每一个学生积极发言,要让每一个小组中的中下等学生体会到自己的意见也是很重要的,自己是小组中不可或缺的成员,自己的参与会对整个小组的表现有重要的作用。同时,也要让组内的同学给其他同学参与的机会,互相帮助提高。例如,可以设计“《莫高窟》一文的第二节和第三节分别写了什么?写法上有什么特点?”这样的问题在小组内展开讨论对于简单的问题,小组的同学可以留给中下等的学生回答;对于较难的问题,也可以先让后进生回答,然后由成绩较好的同学补充,再进行集体讨论。学生一般会回答“运用排比的修辞手法进行描写”,但是对于“先整体概括描写,再选出一个个体重点介绍”这一个写作特点却难以发现,这就需要集体的智慧和老师的点拨。

三、鼓励发言

参与课堂的方式有多种,在“学讲方式”中则重点突出学生的“学进去”与“讲出来”。“学进去”可以包括自主独立学习,也可以包括通过集体讨论后的领悟。语文教学中很多的问题答案可以是丰富多彩的,甚至是允许互相对立的。语文教师要多鼓励学生张开口“讲出来”,只有多让学生“讲出来”,才能锻炼学生语言表达的能力,促进学生的学习。以《莫高窟》为例,可以让学生在运用多种朗读方式、充分熟悉了课文内容之后,依据自己的理解说说文章的写作思路。同时,要通过这一环节让学生学会概括和找中心句、关键词。例如,第二节、第三节、第四节都有很明显的中心词:彩塑、壁画、藏经洞。教师还可以引导学生找出对于“彩塑”“壁画”和“藏经洞”概括的评价词语。教师可以播放关于《飞天》的视频,让学生全面认识“飞天”的状貌,然后让学生仿照第三节关于“飞天”的一段排比句,用“有的……有的……”写句子。让学生“讲出来”,是促进学生积极主动思考的手段,是学生养成参与课堂习惯的主要策略。

四、深入探索

教学不单是知识的传授、技能的训练,还要引导学生探索的意识,让学生从文本的学习延伸到课外。但现实情况是一些语文教师都习惯于只就文本分析课文,以本为本。其实这种认识是不负责任的,展开探索是基于不拘泥于文本知识,让学生能够有更开阔的视野、更深刻的认识、更全面的分析而开展的,可以让学生获得更多的知识和技能。在学习《莫高窟》一课的时候,对于第四节中看似随意的谈到清王朝腐败无能导致藏经洞中的文物被别的国家掠夺的两个句子,在语文教师介绍完这段历史之后,学生可以展开讨论,谈一下自己的感受或者认识。

五、结束语

当文本教学与“学讲方式”相遇,语文教师要处理好学生自主、参与、发言、探索的环节,把课堂还给学生,让“生进师退”成为课堂的常态,真正发挥学生的聪明与智慧,让语文文本与学生的思想一起飞起来。

参考文献

[1]赵丽.“学讲方式”下文本教学的处理方式[J].课外语文,2015(22).

[2]徐翠.儿童文学与小学语文教学研究[J].成才之路,2015(25).

文本方式 篇6

一、建设项目跟踪审计原理

目前国家审计对国家建设项目的审计主要是项目概算执行审计、项目预算执行审计和项目竣工结算执行审计。虽然不同审计方式是在不同阶段对项目进行审计, 审计的侧重点也有所差异, 但是国家建设项目的最终标的还是工程造价控制。

造价控制的控制节点贯穿于工程建设的全过程, 即体现在对工程建设前期可行性研究、投资决策、到设计、施工及竣工交付使用前所需全部建设费用的确定、控制、监督和管理的全过程。全过程跟踪审计正是基于对工程造价控制节点的监督达到控制工程造价的目的。

审计部门对国有建设项目的跟踪审计有全过程跟踪审计方式。部分跟踪审计方式及竣工结算阶段跟踪审计方式, 无论是全过程跟踪审计还是部分跟踪审计方式都是以自动控制方式理论为基础, 包含审计信息收集、信息分析、信息反馈、信息处理等环节 (如图1) 。

二、国有建设项目跟踪审计的特点

国家建设项目是由政府投资进行建设的项目, 具有投资额度大、建设工期长、参与部门多的特性, 衍生出国有建设项目跟踪审计独有的特点。

一是项目涉及单位多, 项目信息面广、审计信息量大。相对于一般建设项目业主单位、监理单位、施工单位的简单三方模式, 国有建设项目还涉及到掌管建设项目审批的发展和改革部门、掌管项目建设资金调配的财务部门、项目具体管理的建设部门、以及项目设计、造价等咨询机构。这就决定了国有建设项目跟踪审计涉及的范围远远超过一般建设项目。此外, 国有建设项目全过程跟踪审计是从项目立项阶段到项目交付使用的监督过程, 审计跨度时间长, 审计事件多, 审计信息量大。

二是项目信息传递线路长, 信息标准不一致, 信息传递呈纺锤型。国家建设项目参与建设管理的部门多, 以项目为面向对象进行项目信息管理体系, 项目建设信息传递节点多、信息传递线路长, 容易形成中间信息传递通道小的纺锤型信息传递组织。

三是项目变动大, 项目信息刷新快, 审计信息呈动态特性。在跟踪审计的项目中, 项目的建设是处于不断变化过程中的, 项目工程进度、项目完成投资额等项目信息是处于不断的刷新状态, 跟踪审计的信息也处于不断的变化中。

三、目前国家建设项目跟踪审计组织遇到的困难

目前无论是在整个项目监督管理体系还是在审计系统内部的审计信息处理, 大部分国有建设项目的跟踪审计组织都是按照职能型组织进行架构 (如图2:职能型跟踪审计体系) 。而审计信息组织方式也是按照传统的文本式信息组织方式进行组织。这给审计部门进行审计信息处理工作带来了相应的困难。

一是信息不畅通, 信息处理不及时。当某一节点出现异常时, 信息长途传递才能到达审计部门, 致使跟踪审计小组难以在第一时间形成对审计重要事项的响应, 或影响项目的建设工期, 或形成审计部门对审计事项的“秋后算账”, 达不到跟踪审计的目的。如, 某建设项目桩基础工程施工过程中, 岩土的实际情况与设计时有一定区别, 由于变更的信息逐步传递, 当此项信息到达跟踪审计小组时已经时一个多星期以后, 在审计人员没有做详细记录的情况下, 跟踪审计项目的下一步工序已经把桩基础施工的相关信息覆盖, 致使审计人员耗费更多的时间和资金还原原来实际施工事实。

二是信息不畅通, 审计信息失真。假设信息在每一个节点进行交换时信息交换的概率为P1;而在每条链传递时信息完整传递的概率为P2, 则信息熵为:

显然有H﹥0, 且随着交换节点的增多, 及信息传递线路的增加信息传递过程中获得的熵越多。由于熵的获得意味着信息的丢失。项目审计信息传递线路越长, 交换界面越多, 跟踪审计人员获得真实审计信息的可能就越小。此外审计信息传递线路的纺锤型结构, 造成信息的拥堵, 在一定程度上降低了审计信息的可靠程度, 加大了审计风险。

三是审计信息零乱, 不利于审计处理。由于审计部门跟踪审计的项目往往是国家或地方重点工程, 参与到项目建设和管理的部门多。每个部门一般都会习惯性地按照本部门、本行业的理解对信息进行加工和处理。由于处理的依据和参数不一样, 因此不同部门对信息的理解也不一样, 这给跟踪审计小组集约处理信息带来了困难。如, 对项目完成投资额, 业主单位是以已经报量数来确定, 施工企业认为是完成的工程量与相应单价的乘积, 而财政部门统计的数据是已经拨付的资金量, 这给审计小组进行审计分析带来困难。

五、国有建设项目跟踪审计超文本组织架构设想

相对于传统的管理组织, 超文本组织管理组织是一种新型的管理技术组织结构, 它借鉴了多媒体结构的优点, 以节点为单位组织信息, 在节点与节点之间通过表示它们之间关系的链加以连接, 并以组织内部的某种协定来传递信息, 从而构成表达特点内容及信息传递网络管理组织。

(一) 超文本组织机构的特点

1. 提高了审计信息的真实性

作为信息管理机构体系, 超文本组织的信息传递过程与按照内部线性隶属关系由上级传递到下级或者由下级传递到上级的文本式组织关系有很大的区别。从图中可以看出超文本组织实现了交互式连接而非线性连接, 当组织中某两个单位 (即组织中的两个节点) 需要传递信息时, 传统组织方式包含两条链, 三个节点, 四个接口;而超文本组织只有一条链, 两个节点, 两个接口。

假设传统文本式管理组织信息传递过程 (A) 中的信息熵为H1;超文本管理组织信息传递过程中的信息熵为H2, 根据组织接口和链口状态, 则由信息熵的理论有:

显然有H1>H2>0。因此, 超文本组织能够使信息在传递过程中减少信息的丢失。在宏观层面, 减少信息交换的节点和界面, 主要是表现在由于传递面的增多, 传递人员性格和偏好致使信息有相当的扭曲。

2. 缩短审计响应的时间

能够及时有效地反馈信息, 提高组织的工作效率, 超文本组织缩短了传递信息的线路, 使信息在连接链行走所需的时间缩短;同时减少了途径节点的数目, 使信息在节点滞留的时间相对减少。从而信息在各个部门传递相对于文本组织便捷, 为实现协同和快速反应提供了宝贵的时间。

如, 在项目设计变更过程中, 通过构建超文本跟踪审计监督机构, 审计机关可以迅速掌握变更前后的数据情况, 做好审计记录, 为审计判断提供了及时的参照参数。

3. 容易形成协同效应

在传统的文本组织中, 组织内部各单元都需要自己收集信息。当需要其他部门的支持时, 需要得到组织内部高层的首肯和协调, 造成了组织内部的各个独立单位的孤立状态, 会使组织内部各部门处于孤立无援的状态。

在国有建设项目的建设过程中, 各自独立监管的状态使各部门掌握的项目信息不全面, 使得施工单位有空可钻。在超文本组织方式下, 进行跟踪审计的审计部门为各单位搭建了信息沟通平台, 实现了监管的协同效应, 形成了对施工单位的监管合力。

(二) 国家建设项目审计体系超文本组织的基本架构

国家建设项目审计体系超文本组织围绕项目建设为中心, 以审计信息传递为纽带实现项目监控组建的项目监控体系。它包含政府投资决策体系、项目运作体系、项目咨询体系和政府审计监督体系。

政府投资决策体系是国家建设项目主管机构。由于它们分别负责项目的审批、资源分配、外部管理等工作, 政府投资项目监管体系中, 政府投资决策监管体系需要设置相关的决策机构和信息联络员。

项目运作体系是项目的具体实施部门, 它们是被跟踪审计行为的实施者, 也是项目具体信息的提供者。为及时地提供审计信息, 项目运作体系的各单位应设置相关信息处理员和信息联络员。

项目咨询体系是建设项目的论证机构, 是项目相关技术支持的主要提供者。为保证项目建设信息的完整性, 咨询机构需要设置相关的资料报关员, 为项目的跟踪审计提供比较资料。

政府审计监督体系是国家建设项目跟踪审计的组织者和实施者。它一般由跟踪审计实施小组和法规部门中的信息收集人员、审计分析人员、法律支持人员和指挥协调人员构成。

(三) 超文本组织方式下跟踪审计的实施过程

项目跟踪审计是与施工同时进行的, 随时可能发现一些问题, 需要有关部门和单位随时予以纠正, 如果按常规的审计程序执行, 就会失去纠正时机, 跟踪审计的效果和作用就会减弱。超文本组织方式下跟踪审计的实施过程就是要发挥超文本组织的沟通和协调作用。一是和相关单位进行沟通, 第一时间获得项目建设的第一手资料, 对重大审计事项做好审计记录和审计取证。二是对审计发现的问题进行沟通和协调, 避免审计工作“秋后算账”。审计人员根据各组织单位反馈的意见进行研究, 并根据实际情况向相关部门提交阶段性审计报告及管理建议书。三是审计工作结束后, 根据整个施工过程中的审计情况向建设单位提交最终审计报告, 对整个施工过程和管理活动情况作出评价和总结。

(四) 超文本组织方式下跟踪审计的信息组织方式

在超文本组织方式下跟踪审计组织通过和政府决策体系中各部门构建信息渠道获得项目决策信息、资金信息以及其他项目前期信息, 形成原始真实信息;通过和项目咨询体系中各单位获得设计参数信息、造价参数信息, 形成比较原始信息;在项目的建设过程中通过建设单位、施工单位和监理单位及时获取资金、进度、质量信息, 形成项目的建设基本信息。

跟踪审计小组通过审计信息分析, 形成审计初步判断为形成审计决策提供依据。审计小组在获得审计决策信息后通过口头或书面的形式反馈到项目建设各方, 形成审计结果信息。

六、超文本组织方式下跟踪审计规范

国有建设项目超文本组织跟踪审计结构是在长时间跨度, 长工作内容跨度下对国有建设项目进行现时跟踪监督的一种尝试。它除了需要国家审计机关进行周密的审计安排以外, 还需要组织内部进行协调分工, 保障审计信息完全畅通。

(一) 进行分工和协调

项目施工阶段的跟踪审计人员要有良好的综合素质, 一般应有施工现场工作经验, 熟悉施工作业程序, 掌握工程项目投资、进度、质量控制内容和方法。审计人员在跟踪审计过程中, 不仅要与施工单位、监理单位协调工作, 还要与建设单位各相关部门协调, 因此要求审计人员不仅要有一定水平的专业知识, 还要有良好的沟通能力和协调能力。国有建设项目跟踪审计小组以3名审计人员构成为宜, 一名审计人员负责审计信息的搜集和分析, 一名审计人员负责跟踪审计事件的处理方案的拟定, 一名管理人员负责外部协调和审计事件的上传下达。

此外, 为了保证审计人员在跟踪审计过程中的公正和独立性, 审计机关应建立相关规章制度对审计行为进行约束。经过实践检验《跟踪审计实施办法》、《跟踪审计操作规程》详细规定了跟踪审计的目标和方法、程序等几大要素, 使跟踪审计有章可循, 是跟踪审计顺利进行的良好保障。

(二) 约定项目参与各方的被跟踪审计行为, 为跟踪审计提供保证

由于审计机关是在未下达审计通知书情况下对项目进行的跟踪审计, 审计人员除了依靠审计法作为工作支撑外, 很难找到更加有力的依据来开展审计工作。为保障跟踪审计工作的顺利进行, 审计机关在项目开始建设前应当建议政府相关部门制定相关条约, 督促项目建设各方都要接受审计机关的监督。

如, 某审计机关在进行某大型基础设施建设跟踪审计前, 通过政府行为在甲乙双方的合同中约定“项目建设过程甲乙双方都应自觉接受政府审计部门的监督”, “项目决工结算在审计部门保持客观公正的基础上, 以审计部门的审核结果为准”, 从而规避了施工单位以各种借口阻挠跟踪审计工作的行为。

(三) 构建外部协议, 提高审计信息的精确度

跟踪审计更多的是关注活资料, 及工程建设的动态变化, 如设计变更, 隐蔽工程等。各部门对审计信息的理解不一致, 对特定问题的理解不一致, 得出的结论致使审计判断产生误差。在设置超文本组织机构过程中, 审计部门应该建议在项目建设各方设置信息传递协议, 对信息传递途径和传递方法做出相关规定, 保证信息的一致性、连贯性。

此外, 审计人员应当建立跟踪审计信息体系, 对接受到的信息进行处理。同时会对审计事项提供更多的信息, 如完善制度的建议, 采购比价的建议, 这是被审单位对跟踪审计的认同之处。审计的最终目的是要从制度上和体制上解决问题, 跟踪审计的“审、帮、促”能起到一定的作用。

七、结语

超文本组织跟踪审计作为国家建设跟踪审计的一种制度性尝试, 虽然在实施过程中遇到审计信息组织协调不畅、审计法律支持不充分等困难, 但是随着跟踪审计组织工作的规范化, 也会朝着科学化、合法化的方向发展, 将在国有建设项目的跟踪审计过程中不断普及。

摘要:在国有建设项目跟踪审计中, 审计组织工作的好坏直接影响审计的质量。文章通过构建超文本审计组织来协调审计信息的分析和传输, 寻找一条适应于国家建设项目的跟踪审计组织方式, 为政府审计机构组织项目跟踪审计提供参考。

关键词:审计,超文本,组织,信息

参考文献

[1]侯度舟, 林飞腾.国际工程承包风险管理超文本组织的架构[J].西安建筑科技大学学报, 2003 (, 4) .

[2]刘英来.关于审计质量控制的思考[J].审计研究, 2003, (4) .

[3]吴涛, 海峰, 李比强.界面与管理界面分析[J].管理科学, 2003 (, 1) .

文本方式 篇7

教育家陶行知倡导学生的“六大解放”,其中一条就是“解放学生的空间”。 解放学生的空间,首先要解放学生的思维空间,采用不同的活动方法,可以帮助学生解放自己的思想。 中职语文的文本文体多样,活动方式如果一成不变,那么不仅不会解放学生的空间,反而会抑制学生的思维,更不用说提高学生的学习兴趣。 因此,从教材出发,根据不同文体不同内容设置多样化的活动方式是改变课堂死水的一剂良方。

一、用复述理顺故事的情节

复述是在理解吸收的基础上讲述和转述原文的内容,因为它富有创造性,能把记忆、思考、表达三者有机地结合起来, 语文的复述能够培养学生的语感,是语文教学的核心。

小说的情节是小说教学的着力点,在小说教学中,按故事的开端、发展、高潮、结局等几个部分划分小说段落,这样使篇幅很长的课文便于分析,而如果让学生复述故事情节,或让学生变换叙述的角色, 那么不仅可使课堂上学生的注意力集中在文本上,还可很巧妙地把口语训练结合到文本教学中。

例如高等教育出版社基础模块上册 《情人节的玫瑰绽开在教室里》一文,就可让学生按以下要求,把课文进行复述训练:一是按时间、地点、人物、事件的起因、经过、结果复述全文情节,二是把文章分成“古希腊学与美的女神阿芙罗狄蒂与美少年阿多尼斯神的爱情故事”和“瓦伦泰因在给心上人写了情书后,坦然走向刑场的故事”两个故事复述。 学生经过一节课的读与复述的过程,不但提高记忆与复述能力,而且把小说的情节梳理得一清二楚,容易记住课文的内容,为下一堂课———文本分析做好了铺垫。

二、用简笔画勾勒散文的片断

中职教材选取了许多优美的游记散文与写景抒情散文, 这些文章都有很高的鉴赏价值, 但学生对此类文章却兴趣不浓,一篇文章上完,有的学生甚至还不知道内容,特别是男生多的班级,他们几乎很少主动朗读,因此,在教学过程中,要把此类文章作处理,激发学生阅读兴趣。

如《善良》一文,可让学生试着用简笔画的方式画出善良人的脸等。 又如《小溪的行程》,在分析小溪行程的四个阶段时,学生很难理解这四个阶段的意义,就可以让学生以人的脸代替小溪,用一组简笔画分别画出不同阶段小溪的神情变化。 学生在阅读文本后,就找到了表现小溪神态的词语,把它在山上蜿蜒爬行时的神态画成了“谨小慎微”的神情,把面对万丈悬崖时的神态画成了“忧悒惶恐”,把直立成为瀑布时画成了 “兴奋、快乐”,把再次面对遥遥征程时画成了 “目光坚定 ”。 当学生在课堂上能够顺利地拿出作品时, 就证明已深入地理解了文本。

三、用选图激活说明文的画面

说明文历来为同学们所不喜爱,在中职生眼里更是这样, 他们认为说明文就是一种枯燥无味的文体,如何让他们主动接受它,这就要求老师从活动入手,打破说明文教学的传统框架。

中职语文教材所选的说明文多以科普小品文为主, 文章的画面感强, 这样就可以让学生根据课文的内容选择一些图片,结合课文的内容进行解说,如《地球,我们的家园》,预习课文时, 可布置学生根据课文的内容分组上网找寻与文句的描述相搭配的图片,图片制作成幻灯片,课堂上推选一名学生进行朗读,同组学生根据朗读的进度播放所选的图片。

用这种方式激活说明文的画面, 把说明文的内容变得有趣味性、有画面感。 学生在准备材料的过程中,不仅要熟悉课文的内容,更要理解课文,方能依据课文的内容挑选图片。 这样的一个活动,学生对文本阅读四次以上,对课文的熟悉程度是单纯读课文的几倍,而且学生不会觉得文章枯燥无味,无法激发阅读兴趣。

四、用朗读体味诗歌的内涵

朗读是一种口语交际的重要形式和传情艺术, 是朗读者把文学作品转化为有声语言的再创作、再表达的艺术活动,诗歌的形式较为多样化,可以吟咏、朗诵。

在教学中, 可采用多样化朗读的方式把文本的内容展示在学生的面前,或由老师及朗读较好的同学示范朗读,如教材里的古诗;或如《致橡树》,可把诗歌内容分成两组,男女生分组朗读;还可以灵活地把主题相关联的诗歌比较朗读,如《我愿意是激流》、《致橡树》和《当你老了》,三首诗歌的主题都是爱情,但是三首诗歌所表达的意思却完全不同,学生通过三首诗歌的朗读、比较、思考,不难感受到《我愿意是激流》的热情的表白、《致橡树》的冷静的述说和《当你老了》的浪漫的想象。 又如《念奴娇·赤壁怀古》等诗词还可组织学生进行方言吟诵, 或采用配乐朗诵等方式提高学生诵读诗歌的兴趣, 体味诗歌的内涵。

五、用书签再现古诗文的精华

《中职语文教学大纲 》对古诗文的要求是 “诵读教材中的古代诗文,大体理解内容,背诵或默写其中的名句、名段、名篇。 激发学习古代诗文的兴趣,增强热爱中华民族传统文化的思想感情”。

古诗文是中职学生的薄弱点,如何激发他们的兴趣? 不妨采用制作书签的方法。 学生在初步读完课文,解决课文里的生字词后,要求学生找出对人生有影响的句子,并把这些句子制作成书签,让学生在课堂上展示自己的成果,并说明选择这个句子的理由。 这样做的目的是让同学把文本里的句子理解透彻,同时也让同学在整理句子的过程中完成文本的翻译。

其实, 所有活动都是为了提高学生对文本的阅读和理解能力,提高学生对文本阅读的兴趣。 当然,不是所有文体都适用方法,每个文章都各具特色,只要教师认真思考,努力创新, 学生对文本的阅读兴趣就会提高。 只有他们熟悉教材的内容, 教师在课堂上教学其他内容才会有的放矢。

文本方式 篇8

关键词:MapReduc,分片,TextInputFormat,CombineFileInputFormat

中文分词是中文文本处理的基础,具有十分重要的理论和应用意义[1]。目前中文分词算法主要有3类:基于词典的分词方法,基于概率的分词方法和基于人工智能的分词方法。国内一些大的科研机构都对中文分词做了研究工作,比如,北京航空航天大学计算机系于设计实现CDWS中文分词系统[2],中国科学院组织开发了基于多层隐马尔科夫模型ICTCLAS分词系统[2]。国外成熟的中文分词工具包是IKAnalyzer,它是一个开源基于JAVA语言的轻量级的中文分词第三方工具包[3],采用了特有的“正向迭代最细粒度切分算法”,支持细粒度和智能分词两种切分模式。IKAnalyzer是以开源项目Lucene[4]为应用主体的,结合词典分词和文法分析算法的中文分词组件。Lucene是Apache基金会下的一个非常优秀的全文检索工具软件包,它可以嵌入在Java系统中,通过建立倒排链表结构,建立索引实现信息检索,具有高性能、可扩展的特点。

但是这些分词方法都是传统的串行分词方法,不足以处理海量数据,例如微博数据[5],它是一种社会化媒体,包含了丰富的特征信息,具有规模大、实时性强、内容口语化、特征属性多和噪声大等特征[6]。

由Google实验室提出的Mapreduce并行分布式计算模型主要针对海量数据的处理,它能组织集群来处理大规模数据集,成为云计算平台主流的并行数据处理模型[7,8]。本文基于Mapreduce框架,通过结合使用IKAnalyzer和Lucene实现并行分词。

Mapreduce框架中默认使用Text Input Format文本输入方式[8],该方式的对行文本的切分方法不适合处理由大量小文本组成的文件。本文基于Combine File Input Format父类,自定义文本输入方式My Input Format,继承父类get Splits方法,重写isSplitable方法,并通过定义My Record Reader类实现create Record Reader方法,改进文本分片切割方式。实验证明,基于改进后的My Input Format文本切片方式比默认的Text Input Format切片方式,更能高效地处理大量文本文件。

1 相关工作

1.1 Map Reduce实现框架

Map Reduce是一种分布式开发的编程模型[9,10],用户可以根据多种语言来进行应用程序的编写。它提供了简洁的编程接口,底层框架可以自动并行化基于这些接口开发的程序。由于用户不需要处理与并行化相关的工作,可以其中精力编写业务逻辑,开发效率较高。

Map Reduce作为Hadoop的核心计算模型[11,12,13],它通过将输入数据切割为若干个Input Split来实现并行化。其工作流程如下图1所示:

1.2 默认Text Input Format输入方式实现并行分词

Input Format类是Map Reduce框架中输入方式的最顶级的抽象类,该类从两个不同的角度设定定义了get Splits和create R-ecord Reader两个方法。get Splits方法负责切分输入文件,它把很多的输入文件切割成很多的输入分片Input Split,每个InputSplit分片都将被交给一个单独的Mapper处理;create Record Reader方法提供了一个Record Reader对象,该对象从InputSplit分片中解析出<key,value>键值对。这两个方法都是抽象方法,由其子类对方法进行具体实现。

File Input Format抽象类继承于Input Format类,用来专门处理文件类型的数据。该类只实现了get Splits方法,并没有实现create Record Reader方法。get Splits方法返回的分片类型是FileSplit。File Input Format在默认情况下为文件在HDFS上的每一个block(128MB)都生成一个分片,可以通过设置作业的配置参数mapred.min.split.size和mapred.max.split.size来设置分片大小的最小值和最大值,但是一个分片只能包含来自于一个文件的block。

Text Input Format类继承于File Input Format类,是Map Reduce框架默认的文件输入格式。它继承了父类get Splits方法。因此,它的分片内容只能来自于一个文件的block。如果输入文件有上万个,那么就会产生上万个分片,进而需要调用至少上万个Mapper,这对于大量小文件而言是工作效率极其低下。该类实现了create Record Reader方法,该方法返回的是line Record Reader对象,该对象将输入数据每行都解析成一条<Key,Value>记录。其中Key代表每个数据的记录在数据分片中字节偏移量,类型是Long Writable。Value代表每行的内容,类型是Text。

每个分片都只包含来自于一个文件的block。每个split分片都将交由Mapper处理,Mapper端的run方法通过调用Text Input Format方法中返回的line Record Reader对象,将分片解析成<key,value>键值对,并进行并行分词,分词任务是将输入数据的文件夹名(类别)作为key,文件的行文本作为value,并行分词流程图如图2所示:

2 改进数据输入方式实现并行分词

Text Input Format的切分方法默认情况下为文件在HDFS上的每一个block(128MB)都生成一个分片,并且一个分片包含的block只能来自一个文件。当数据集由大量的小文件组成时,这种输入格式是极其低效的。

2.1 自定义My Input Format类

首先,自定义继承于Combine File Input Format抽象类的MyInput Format类。Combine File Input Format类继承于File Input Format类,它重载父类的get Splits方法,返回的分片类型是Combine File Split。Combine File Split类中定义的paths数组用来记录每一个文件的路径,即它可包含多个文件的路径,这是与Text Input Format类在分片逻辑上的最大不同之处。My Input Format继承父类的get Splits方法,使得一个分片可以包含多个文件的block内容。假如file1,file2两个文件各有3个数据块组成,则这两个文件的切分结果示意图如图3所示:

其次,My Input Format重载父类的is Splitable方法,返回false值来保证文件不被分割。

第三,My Input Format实现父类create Record Reader方法并返回Combine Record Reader对象,在该对象类的构造函数中,定义My Record Reader来处理分片内的每个文件。输出的每条<Key,Value>对应一个完整的文本文件。其中Key代表文件所属的类别名,类型是Text。Value代表文本分词结果,类型是Text.

2.2 自定义My Record Reader类

Combine File Record Reader是Hadoop中继承于Record Reader的可以遍历包含多个文件的分片内容的框架[9],在其构造函数的中声明自定义My Record Reader类来说明将文件解析成<key,value>键值对的具体逻辑,方法返回自定义Record Reader对象。

首先,在My Record Reader类中,定义的变量如表1,重载的方法如表2:

其中,next Key Value方法是将文件解析成<key,value>键值对的具体逻辑,是最重要的一个函数,在该函数中设置key值为文件的类别名,FSData Input Stream是Hadoop的输入流类,通过该类对象的read Fully方法可以将读取的文本内容存放在一个与文本内容长度相等大小的字节数组中,并设置文本内容作为Value.

2.3 自定义并行分词My Mapper类

Mapper端的run方法通过调用My Input Format方法中返回的My Record Reader对象,将分片解析成<key,value>键值对,key指的是文件的类别,value指的是文件内容,并行分词流程图如图4所示:

Map Reduce最终实现文本文件的分词。文本分词是特征项提取中最关键的一步,鉴于中英文编码格式的不同,两者的分词格式也不一样,本文结合使用IKAnalyzer2012和Lucene实现分词。设置输出Key为输入Key,定义String Builder对象存储分词结果,并作为输出Value.

由于自定义的My Record Reader的解析逻辑是将文件的类别作为key,文件内容作为value,因此分词过程只需要经过一个map方法就可以得到结果,Map Reduce流程图如下所示:

3 实验

3.1 实验环境

本文实验环境:联想Z470机器,Intel Core i3-2410M,2.3GHz CPU,2GB内存,200 GB硬盘,Windows xp操作系统,JAVA编程语言,Eclipse-4.3.2开发环境,虚拟机vmware workstation10,Centos 6.4,jdk1.6.0_24,Apache Hadoop 1.1.2。在单机伪分布式环境下即可证明该实验的有效性,Hadoop具体环境如图7:

3.2 文本数据准备

本文使用的实验数据集是从搜狗实验室提供的中文文本分类语料库(http://www.sogou.com/labs/dl/c.html),该库提供有mini版,精简版和完整版的文本预料库。在精简版中包含共计9个类别,每个类别含1990篇文章,从精简版数据集中选择不同数量的文本组成大小不同的数据集,具体数据集信息如下表:

3.3 并行分词

步骤1:分别将在Eclipse上编写的两种并行分词程序打成jar包,使用Text Input Format方式的jar包命名为Text Input Format.jar,使用My Input Format方式的jar包命名为My Input Format.jar,并都存放在/usr/local/目录下;

步骤2:在终端执行命令”hadoop fs–put/usr/local/sogou/sogou”将数据集上传至hadoop的sogou目录下;

步骤3:在终端执行命令

步骤4:在终端执行命令

4 结果对比与分析

4.1 分词结果对比

在刚开始执行时,记录job总共的Input Paths,并通过web界面(mlj:50030)查看job的工作状态,记录Job运行时间,实验结果如下表4:

图7是两种输入方式并行分词时间对比柱状图,横坐标表示数据集,纵坐标表示运行时间,由于两种方式花费时间相差较大,纵坐标采用对数坐标。由图7可知,运行时间与数据集的大小成正相关,体育和军事数据集花费时间增加相对较少,说明Hadoop更能处理较大的数据。

4.2 结果分析

默认输入方式对输入数据产生至少与文件个数相等的分片,每个数据分片都交给一个Mapper处理,而且在进行过map之后需要合并到reduce端,这会大大增加网络拥堵。因为每个Job从建立、处理、提交到写到本地都需要一定的时间,并且在单机环境下只有一个Mapper,它只能顺序地执行每一个Job。这样分片的数目越多,Job需要花费的时间也就越长。因此处理大量小文件的速度就会非常慢。

而My Input Format文件输入格式则将所有文件作为一个分片进行处理,输入方式则允许一个分片包含多个文件块,大大减少了Map个数,并且改进后并不需要reduce合并处理,省去了建立多个Job所消耗的时间,这大大提高了并行分词的效率。

5 结束语

本文来自 360文秘网(www.360wenmi.com),转载请保留网址和出处

【文本方式】相关文章:

场控文本及警告文本08-04

文本档案05-16

文本形态07-11

文本知识05-08

结合文本05-08

文本思路05-10

文本解析05-15

公开文本05-22

走进文本05-25

文本层次05-27

上一篇:作用与思考下一篇:统一法律职业资格考试