大数据驱动产品创新

2024-09-02

大数据驱动产品创新(精选四篇)

大数据驱动产品创新 篇1

一、引子:用谷歌搜索量化电影魔力

2013年6月, 谷歌的媒体与娱乐业首席分析师Andrea Chen与Reggie Panaligan联合发布了《用谷歌搜索量化电影魔力》 (Quantifying Movie Magic with Google Search[1]) 白皮书。该报告以2012年间美国上映的近百部电影为研究对象, 分析了影片上映前各时间段里用户对各类电影信息的搜索行为数据, 揭示了电影相关搜索量与电影票房成绩间存在的强相关性 (见图1、图2) , 构建了利用搜索数据预测电影票房的数学模型, 并据此提出了若干利用搜索优化电影营销策略的实操建议。由于谷歌在“大数据”时代处于全球领先地位, 该报告一经发布, 旋即引发热议, 有关“大数据”如何影响电影产业发展的讨论一时间成为舆论焦点。

具体而言, 白皮书主要发现包括: (1) 观影是一个需要信息搜索辅助决策的过程, 其中数字渠道所起到的作用越来越大。2012年谷歌上电影相关信息的搜索量较2011年增长了56%, 显示出用户观影决策过程中搜索引擎服务使用率的增长趋势。 (2) 通过分析潜在观影者的信息搜索内容与方式, 搜索引擎服务可以帮助电影营销者更好地理解用户的注意力与意图所在, 为其拓展用户互动空间提供独特价值。 (3) 通过查询量、关键字广告点击量, 结合其它电影相关变量 (如电影院数量、电影类型、是否属于特许经营类电影等) , 可预测某部电影首映周末票房, 其准确率可达92%。利用该模型预测随后一周的周末票房, 准确率也可达90%。利用该模型测算发现, 在新片上映的7日之内, 若某影片比同类影片的搜索量高出25万次, 其票房收入要高出430万美元;若它的关键字广告点击量能高出同类影片2万次, 那么它的票房收入则高出750万美元。 (4) 新片首映前四周电影预告片搜索趋势与首映周末票房成绩之间存在强相关性。结合谷歌上电影预告片的搜索量、电影特许经营状况以及季节性因素, 可预测新片首映周末的票房成绩, 其准确率高达94%。 (5) 由于48%的观影者会在决定去看哪部影片的当天购票, 因此电影推广应在首映周末后再持续一段时间, 而不应止于首映。首映之后周一至周四这段时间里, 付费广告点击率是衡量影片能否持续卖座的重要指标之一。

(数据来源:谷歌)

(数据来源:谷歌)

长期以来, 票房收入预测在电影业界都是个至关重要的终极命题, 它贯穿和影响着电影生产的各个环节, 自然也是从业人员迫切需要解决的现实问题。而随着社会意识形态与消费方式日趋多元, 信息生产与消费方式已发生巨变, 观影决策过程变得更加复杂, 量化票房需要考虑的因素更加复杂, 利用传统思维与调查手段来解答上述问题却愈发捉襟见肘。谷歌利用用户网络搜索数据进行票房预测, 一定程度上验证了利用“大数据”量化电影魔力的可行性。但这个案例只是冰山一角, “大数据”对电影产业的影响并不仅仅止步于此。

二、全景:“大数据”对电影业的量化支撑

一般意义上, “大数据”是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。业界将其特征归纳为4个V, 即Volume (体量浩大) 、Variety (模态繁多) 、Velocity (快速生成) 和Value (价值巨大但利用密度很低) [2]。从“大数据”中挖掘更多价值, 需要灵活运用多学科方法, 目前源于统计学、计算机科学、应用数学和经济学等领域的技术已被开发并应用于“大数据”的整合、处理、分析和可视化。其关键技术主要包括:A/B测试、关联规则挖掘、分类、数据聚类、众包、数据融合和集成、数据挖掘、集成学习、遗传算法、机器学习、自然语言处理、神经网络、神经分析、优化、模式识别、预测模型、回归、情绪分析、信号处理、空间分析、统计、监督式学习、无监督式学习、模拟、时间序列分析、时间序列预测模型、可视化技术等[3]。

抛开复杂的技术术语不表, 电影业最宝贵的“大数据”宝藏蕴藏在用户“大数据”、内容“大数据”、渠道“大数据”三座“矿山”之中。而“大数据”给电影业带来的核心价值在于“洞察”———实时洞察时代变化与社会潮流变化, 实时洞察消费者意识与行为变化。基于实时、细致入微的消费者洞察, 电影业能辨识、锁定新的市场机会, 全面量化电影各环节运营, 从而支撑产品、服务与体验创新, 充分挖掘电影市场的潜力空间。

目前电影业对“大数据”的利用还处于探索初期, 不同环节对数据的依赖程度与运用现状也有所不同。以美国好莱坞为例, 电影产业主要包括五大环节, 分别为电影选题开发、前期制作、影片制作、后期制作与推广发行 (见图3) 。其中, 选题开发与推广发行两个环节对数据的依赖较大, 因此, “大数据”对这两个环节的提升作用最为直接。

首先是电影选题开发环节, 这是电影生产的第一步, 同时也是最需要数据支撑的步骤。选题开发主要包括市场研究、资源分析、概念开发、剧本创作、剧本包装、资金筹措等工作, 需要大量数据支撑将各种想法、创意变成可行性剧本。首当其冲的就是市场研究工作。通过市场研究动态追踪市场需求, 把握消费者口味变化, 从而准确判断市场定位。在选题开发环节, 大数据的运用主要体现在辅助剧本创作、剧本包装、估算影片投资回报率等方面。如2013年2月北美最大的付费订阅视频网站Netflix上线的政治题材剧《纸牌屋》 (Houseof Cards) , 正是利用“大数据”指导内容策划与生产的成功案例———Netflix基于对“电视剧消费习惯数据库”中逾3000万用户的收视选择、400余万条评论、300余万次主题搜索等大数据分析结果, 确立了凯文·史派西主演、大卫?芬奇导演和“BBC出品”剧本的黄金组合, 据此投资一亿美金拍摄该剧。该片被《纽约时报》、《洛杉矶时报》、《经济学人》等海外权威媒体视作“数据革命”的典型案例, 为业界通过“大数据”指导选题开发提供了参考。

其次是电影前期制作、影片制作与后期制作环节, 主要包括: (1) 电影前期制作, 这是影片拍摄前的计划与编制阶段, 主要涉及确立制作核心、拍摄计划编制、剧本内容修订、演员试镜筛选、外景场地选择、确定设计方案等。 (2) 影片制作, 主要涉及实景拍摄、影片粗剪、进度掌控、影片修正等。 (3) 后期制作, 将所有影片元素剪辑成为一个完整的故事, 主要包括最终剪辑、影片混录、影片预映等。在整个制作环节中, “大数据”可以帮助实时洞察消费者变化, 辅助确立主创团队、协助剧本内容修订、提高生产管理效率、优化影片剪辑、量化评估影片预映效果等。

第三是电影推广发行环节, 这个环节是最接近消费者的环节, 对票房成绩能起到关键作用, 同时又是非常昂贵的环节, 其费用支出可能高达影片制作费用的半数甚至以上, 因此, 数据对推广发行的量化支撑至关重要。从营销推广的角度来看, 最深刻的变化来自营销环境和消费者端的巨变。随着用户对新媒体的利用更加普及, 电影营销对搜素引擎、微博、微信、社交平台、移动应用APP等新媒体的依赖越来越大, 而基于新媒体平台的“大数据”是未来实现电影精准营销的基础。通过“大数据”技术, 营销人员能更为深入地理解电影的目标观众到底是谁, 他们有什么消费特征和媒介接触特征, 设置什么样的卖点和策略才能打动他们, 整合哪些媒介才能有效覆盖与到达目标市场。从发行的角度来看, “大数据”能让营销人员实时洞察潜在消费者, 了解不同地域的用户群体在性别、年龄、学历、职业、消费特征、收入状况等方面有何不同, 以此优化院线发行策略、辅助互联网发行以及后产品开发等决策。

以目前最受关注的影片《小时代》为例, 其发行方“乐视影业”在制定营销方案时就参考了兄弟公司“乐视网”的“网络观影调查”数据, 得出结论:“《小时代》40%的受众是高中生, 他们是郭敬明、杨幂等主创的忠实粉丝, 是冲动型消费者;30%是白领, 对《小时代》感同身受, 是营销导航的重点;20%是大学生, 他们是非核心消费者, 但能影响其他受众;另外10%则为目前观影年龄在26到35岁之间的主体观众, 他们是需要消除顾虑, 扩大外延的群体”。基于上述数据, “乐视影业”制定了社会化媒体营销、手机客户端以及地面导购系统的全方位市场营销方案。从营销效果来看, 近日来《小时代》位居百度“搜索风云榜”电影榜单首位, 其“搜索指数”远高于其它电影。当然, 《小时代》的票房成绩也非常亮眼, 首映三日便超过两亿, 截至2013年7月8日其票房累计已达4.19亿[4]。

总而言之, “大数据”对电影业的影响不仅仅局限于当下热议的内容生产领域, 谷歌利用网络搜索数据预测票房也只是电影领域“大数据”的简单利用案例之一。若着眼中长期发展, 从选题开发、影片前-中-后期制作、营销推广再到发行及终端放映, 电影产业的每一个环节都蕴藏着数据化运营的可能性, 而“大数据”对全球电影业的深刻改造也才刚刚启幕。

三、思考:“大票房”时代的“大数据”难题

与成熟的好莱坞体系相比, 中国电影产业还存在不小差距。2012年美国电影总票房约108亿美元, 这一规模约为中国的四倍;2012年美国电影产业规模为900亿美元, 而中国电影产业规模仅为34亿美元[5], 仅为美国的3.78%。尽管如此, 中国电影产业高速成长态势却让人难以小觑。受益于国家深化文化体制改革、推进文化产业大发展大繁荣的政策红利, 中国电影产业持续高速发展, 电影票房连续10年大幅增长。最近3年中国电影票房的增长情况如下 (见图4) 。而据“艺恩咨询”最新数据显示, 2013年上半年国内共计上映影片146部, 其中国产电影117部。截至6月23日, 全国电影市场总票房达102.65亿, 国产片票房累计64.67亿, 全年票房有望突破230亿。中国电影产业已迈入名副其实的“大票房”时代。

(数据来源:国家新闻出版广电总局)

虽然“大数据”已经成为国内“大票房”时代的热门话题, 国内部分电影机构对“大数据”也时有运用, 但在当前阶段盛赞“大数据”对电影的“神话”改造却为时尚早, 其概念营销的意味远远大于实际作用。总体看来, 国内距离真正运用“大数据”全面支撑电影产业创新还有很长的路要走, 目前还面临着诸多现实困难。

首先, 目前国内电影“大数据”来源分散, 类型混杂, 实施“大数据”挖掘需要整合多处数据来源、打通数据平台、吸引跨界合作, 实施难度很大。在当前环境下, 除了电影制作公司、电影院线自行收集的数据之外, 来自搜索引擎、视频网站、门户网站、垂直网站、电影社区、社交平台、电子商务、移动应用商店等渠道的数据都可不同程度地对电影选题开发、前期制作、影片制作、后期制作与推广发行环节的量化运营形成支撑作用。但要整合这些海量、分散、庞杂的数据资源, 并非易事, 也非一家能成之事。

其次, 国内电影“大数据”透明度不高, 真实性难以确定。前文提及的“大数据”资源分属百度、腾讯、新浪、阿里巴巴、优酷土豆等互联网企业。这些“大数据”平台彼此独立, 彼此封闭, 并不会完全透明地开放给第三方电影调查公司, 自然也难以形成“非抽样、而是全体样本”的“大数据”全景。除数据平台难以打通之外, 数据的真实性也是症结之一。长期以来, 国内电影业并没有建立起数据公布共享的行业惯例, 即便是票房数据在前几年都不会被完全公开, 更不谈其它深度运营数据了。因此, 缺乏真实数据的输入, 设计什么“大数据”模型都是枉然。

再次, 光有数据远远不够, 还需要懂得如何建立数据模型, 如何解决中国电影的实际问题, 这样才能避免数据研究失焦、走偏。以开篇《用谷歌搜索量化电影魔力》中提到的票房预测模型为例, 它在解决美国问题时宣称其准确率高达94%, 而搬到中国却面临尴尬。据百度“爱奇艺”创始人、首席执行官龚宇透露, 他曾尝试把中国电影数据套进谷歌的票房预测模型, 但预测结果的准确率却很低, 同时“百度也尝试过预测票房, 但是效果不佳[6]”。同样以电影搜索数据为基础, 同样的数学模型, 准确率却大不相同, 可见照搬国外算法与模型是很难行得通的。据业界资深人士介绍, 现阶段国内约90%以上电影调查公司都以“百度指数”作为研究基础模型, 再综合题材、主创阵容等指标进行定量分析, 其分析深度、数据精度、准确度整体并不高。谷歌模型失效的背后, 暗藏着中美电影市场的巨大差异, 要深度解读这些差异、量化支撑中国影业的发展, 则亟需重塑与构建更懂中国、更适合国情的数据思维与计算模型。而要达成这些目标, 不仅仅需要“大数据”的思维、知识与技能, 更需要懂电影、懂技术、懂数据、懂运营的跨界人才储备来做支撑。而目前国内“大数据”人才非常紧缺, 这也将是未来制约中国影业长期发展的瓶颈所在。

最后, 回归电影的本质, 它不仅是门“技术活”, 也不仅仅只是门赚钱“生意”, 它更是一个艺术乐园, 一个奇幻魔法场, 它为人类创造了丰富的光影时空与奇特的人生体验, 这在“大数据”时代依然历久弥新。也许“大数据”能帮助影人洞察人心、助力新片票房大卖, 但它却永远无法完全取代电影艺术家们的创意、智慧与艺术贡献。

参考文献

[1]Google (June 2013) .Quantifying Movie Magic with Google Search, July.1, 2013, from google site, http://www.google.com/think/research-studies

[2]李国杰, 程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考.《战略与决策研究》, 2012 (6) , 647-657.

[3]McKinsey Global Institute (May 2011) .Big data:The next frontier for innovation, competition, and productivity, June.4, 2013, from mckinsey site, http://www.mckinsey.com.

[4]搜狐娱乐, 《〈小时代〉累计4.19亿》, http://www.dzwww.com/yule/yulezhuanti/mtcbg/201307/t20130708_8641539.htm

[5]中新社, 《中国电影业规模为美国1/26全产业链或成新方向》, http://finance.chinanews.com/cj/2013/06-19/4947437.shtml

大数据驱动公共管理创新论文 篇2

[关键词]大数据;公共管理;数据管理

随着科学技术的发展,人类进入大数据时代,全世界每时每刻产生海量信息数据,这些数据从各方面完整记录了人类的社会活动。与此同时,人们又可以通过各类工具和平台,从不同的层面、维度和目标对数据进行分析,进而改变了人类对世界的认知。公共管理是指政府公共管理部门整合各类社会力量,通过政治、经济、法律、管理等手段,提升政府绩效、治理能力和公共服务品质。如何运用大数据技术,有效分析并解决当前公共管理中面临的诸多问题和挑战,是公共管理部门探索科学发展、提升治理绩效的重要课题。

1大数据的内涵与特点

深层次意义上的大数据,由Google公司在十周年庆祝大会上提出。传统的数据处理方式更多是基于算法,通常需要预设数据分布和误差结构。而大数据的独特之处在于其不局限于算法和数据本身,在运算前无需假设,以挖掘隐藏在背后的数据价值为核心,数据的运算结果更为精密和准确,并且能从各类型数据中获得有价值的信息。大数据的特点主要表现在:一是数据量大。如今,各类终端设备都已成为数据获取和采集的来源,这些设备随时随地产生大量的原始数据,而这些数据又通过各种通信方式连接并汇聚到各类数据平台。因此,大数据最明显的特征是涵盖了全体数据,且数据体量特别大,其计量单位至少是PB,有些达到EB甚至ZB。二是种类多样。大数据一方面存在着数据获取渠道的多样性,将不同来源的数据进行跨界整合与分析。另一方面存在着数据类型的多样性,在处理各类信息系统所产生的结构化数据的同时,也分析图片、视频、音频、地理位置、网络日志等非结构化数据。三是低价值密度。大数据的大体量造成了数据高度分散,使得单位密度的数据价值较低,如何通过数据挖掘工作,更快速高效地完成信息筛选,发现隐藏在数据关联关系和因果关系之间的客观规律,并将该规律转化为有价值的信息和策略,是大数据的重要使命。四是高速流动。随着数据获取采集能力的提升,快速的数据流动和加载成为常态,人们对实时数据处理的需求也逐渐增多,进而对大数据的高速分析整合能力带来挑战。

2大数据时代公共管理的机遇

作为社会管理的重要范畴,公共管理水平及质量的提升,对全社会的效率提高和治理进步有重要意义,大数据技术为公共管理的发展带来了新机遇。一是使得公共利益各相关方的诉求能够充分表达和交互。公共事物管理的目标是追求公共利益的不断提升,公共利益的满足有赖于各相关方的利益诉求表达。公共利益是民意的反应,民众通过公共利益表达能够对政府的决策行为产生影响。传统的公共管理模式下,社会组织和公民的参与度较低,导致政府在公共资源配置过程中出现权力寻租。大数据提供多样化的信息渠道,使全体公民利益诉求的收集成为现实,可以从满足社会公众利益诉求的角度,形成解决方案的制定和监督。二是提升社会公共管理决策的科学性。决策在公共政策管理中具有重要意义,需要遵循科学、民主、依法和健全的机制和程序。由于缺乏全面性基础性的工作,长期以来在社会管理的决策过程中,普遍存在科学性缺乏的问题,从而导致公共管理政策的绩效水平总体不高。大数据避免了传统方式的弊端,数据的获取更为全面准确,并在数据的基础上,通过人工智能、数据挖掘和建模技术实现动态监测、趋势判断、融合仿真等任务,在最大程度上还原了相关真实信息,使决策部门能够对方案进行有针对性的改进和完善。

3大数据时代公共管理的挑战

大数据纲要驱动颠覆式创新 篇3

8月19日,国务院总理李克强主持召开国务院常务会议,通过《关于促进大数据发展的行动纲要》,部署发展现代流通业建设法治化营商环境,构建全国统一大市场旺消费促发展,提升创业创新活力和社会治理水平。会议决定进一步加大对小微企业的税收优惠,涵养就业潜力和经济发展持久耐力。

会议通过的《关于促进大数据发展的行动纲要》强调,一要推动政府信息系统和公共数据互联共享,消除信息孤岛,加快整合各类政府信息平台,避免重复建设和数据“打架”,增强政府公信力,促进社会信用体系建设。优先推动交通、医疗、就业、社保等民生领域政府数据向社会开放,在城市建设、社会救助、质量安全、社区服务等方面开展大数据应用示范,提高社会治理水平。二要顺应潮流引导支持大数据产业发展,以企业为主体、以市场为导向,加大政策支持,着力营造宽松公平环境,建立市场化应用机制,深化大数据在各行业创新应用,催生新业态、新模式,形成与需求紧密结合的大数据产品体系,使开放的大数据成为促进创业创新的新动力。三要强化信息安全保障,完善产业标准体系,依法依规打击数据滥用、侵犯隐私等行为。让各类主体公平分享大数据带来的技术、制度和创新红利。

当前,线上线下一体化新商业模式迫近,企业需要通过大数据来挖掘更多可能的生活场景,将互联网公司精准捕捉到线上的消费者行为“导入”到线下实现精准营销。分析人士认为,有了大数据,企业可以据此实现颠覆式创新,创造个性化、定制化的产品,叫车软件的流行、理财宝的面世、移动医疗的应用等都是明证。在可以预见的未来,大数据将成为相当一部分企业的核心资产,将有助于培育经济新引擎。

我国大数据市场仍处于起步阶段,2014年市场规模仅为767亿元,但是有机构预测,到2020年将增至8000亿元。今年上半年互联网热出现一个新动向,就是入口和应用场景的争夺已到了短兵相接的程度。巨头们争夺的最终目标是数据资源,数据已成为DT(数据技术)时代的核心要素。未来最有价值的行业将是数据价值最大的行业,而最有价值的公司将是能设计好的商业模式把数据变现的公司。

大数据驱动的工程审计模式创新研究 篇4

1 传统审计模式在工程管理审计中的局限性

审计模式从传统的账项基础审计发展到制度导向审计,又发展到风险导向审计模式。在制度导向审计模式下,审计人员对内部控制制度进行测试,根据控制测试的结果来进行实质性审计程序。在风险导向审计模式下,审计人员首先考虑审计风险,在能够接受的审计风险下,根据重大错报风险来确定检查风险。在具体的审计程序上,先执行风险评估程序,根据风险评估的结果实施进一步程序,包括控制测试和细节测试等。但是风险导向审计模式,仍然存在着无法完全适应工程审计的问题。

1.1 风险导向审计模式主要运用于报表审计领域,不能完全适应工程审计的需要

现代风险导向审计模式主要是注册会计师在进行报表审计时,考虑到发表积极式审计意见,可能面临的诉讼风险时,采取的审计应对措施,因而风险评估程序以及控制测试、细节测试的时候,都是以会计报告内容为基础实施的,保证财务报告按照会计准则编制,在所有重大方面公允反映了被审计单位的经营状况、经营成果及现金流量。按照中国注册会计师审计准则,在风险评估的时候,主要是考虑可能存在重大错报的六个方面。但是在工程审计中,其审计对象不再仅仅是基于责任方认定的报告,而是对工程活动发生的管理事项、工程财务报告以及工程效益所进行的审计,其审计对象更加多元化和复杂化,而且工程管理活动并不像财务报告有统一的会计准则作为审计标准,工程审计涉及多项法律法规的要求,也没有完整的责任方认定的报告,只能是审计人员在审计过程中根据法律法规以及相应的授权委托进行工程审计活动,因而风险导向审计模式无法完全适应工程审计的需要。

1.2 风险导向审计模式主要是事后审计,不能完全适应工程审计全周期的特性

在风险导向审计模式下,注册会计师主要是在被审计财务报告出具后,才对财务报告整体及各个组成部分进行审计,是一种典型的事后审计。尽管注册会计师也会在中期进行控制测试,但其主要工作是在报告出具后才进行,最终出具审计报告。但是在工程审计过程中,从工程最初的立项、招投标、施工图,到工程的实施、工程竣工决算到工程的后评价等等,经历了一个完完整整的事前、事中和事后审计,如果仅仅只是采用风险导向审计模式,只是在事后进行工程决算审计,那么将无法控制由于立项设计不合理带来的工程失败的风险,也无法回避由于招投标中存在的不规范带来的审计风险高企。因而,在全周期的工程审计中,不能仅仅简单套用风险导向审计模式。

1.3 风险导向审计模式关注合法性和公允性,难以覆盖工程审计效益性的特点

风险导向审计模式脱胎于报表审计,其主要关注点在于财务报告在所有重大方面符合合法性和公允性的要求,因而要求注册会计师在审计过程中考虑法律法规的需要以及重要性水平,而对效益性的关注并不多。但是工程审计并非如此,工程效益是工程审计的一个重点,要考虑工程项目投入的经济性、效率性和效果性,即便是工程决算所有业务都是按照会计准则的要求进行,但如果工程本身存在严重浪费或者工程并不能产生良好的经济效益,抑或是工程上马将会对环境造成极大的污染,那么这样的工程在审计中也是存在问题的。

2 大数据技术发展与工程审计的契合

由于新兴技术和商业模式的发展,全球的数据量迅猛增长。IDC的研究报告指出,仅仅在2011年,全球被创建和被复制的数据总量超过1.8 ZB,而且未来将会呈现每两年翻一番的态势。近年来,大数据引起了产业界、科技界和政府部门的高度关注。2008年Nature出版“Big Data”专刊,从互联网技术、网络经济学、超级计算、环境科学、生物医药等多个方面介绍了海量数据带来的挑战。2011年Science推出“Dealing with data”专刊,讨论了数据洪流(Data Deluge)所带来的挑战,若能有效使用这些数据,将会对社会发展产生巨大的推动力。2012年3月22日,奥巴马宣布美国政府投资2亿美元启动“大数据研究和发展计划(Big Data Research and Development Initiative)”。

大数据具有四大特征:其一是数据种类多样,数据类型包括结构化、半结构化和非结构化的数据。其二是数据体量巨大,数据总量已经达到ZB级。其三是数据处理快速,海量的数据洪流在有效时间能够得到处理。其四是价值密度低,需要从原始海量数据中进行深度挖掘和计算,提炼出具有较高价值的数据。

大数据技术的发展,为工程审计的开展提供了新的契机。

2.1 大数据的相关性特点为工程审计指明重点领域

相关性是大数据的一个重要的特征,在大数据环境下,通过相关性分析,查找出影响某一重要指标的在统计意义上显著的变量,通过这些变量进行进一步的分析,进而得到想要的结果。在相关性分析的技术手段上,可以采用最小二乘法,利用大数据,构建一元或者多远回归模型,在考虑六个古典假设的基础上,通过回归即可得到显著影响被解释变量的主要因素,这些因素可以运用在工程审计之中,即不再是通过风险评估程序确定审计的重点领域,而是在确定审计目标的基础上,通过回归等方法确定影响审计目标的关键因素,把这些关键因素作为工程审计的重点审计领域,进而开展进一步的审计程序。因而,在大数据环境下,海量数据为相关性分析提供了基础,通过相关性分析,确定工程审计的重点审计领域。

2.2 大数据的丰富数据源为工程审计提供分析基础

在海量的大数据环境下,丰富的数据资源为工程审计的顺利开展提供了分析基础。从“审山审船审老天”的审计署2004年优秀审计案例中也可以看出,丰富的海量天气数据、生产销售数据都能够为工程审计的顺利开展提供帮助。

2.2.1 政府机关的权威数据为工程审计直接提供证据

一个法人机构或者组织,从成立、运营到最后的破产倒闭或者单位被撤销,都会在工商行政管理机关、税务机关、统计机构或者组织的主管部门留下大量的有效数据,工程审计人员可以利用这些分析数据直接作为审计证据,进而形成审计结论。例如,税务机关有发票的领用、开具以及回收的信息,在工程审计时,需要审计工程物资的真实性,那么通过税务机关获取工程物资供应单位的销售情况,并把这些销售记录与采购记录进行核对,进而审验工程物资的真实性。

2.2.2 公共服务机构的丰富数据为工程审计提供有价值的证据

工程项目消耗的水电气等是由供电机构、自来水公司以及燃气公司提供的,这些都是公共服务机构。工程项目管理人员与这些公共服务机构合谋的可能性比较低,因而这些公共服务机构的数据也可以直接用来作为审计证据的一部分。例如项目发生的燃气费用,通过燃气公司的表行数和单价可以计算出工程项目消耗的燃气费用,并与实际发生的燃气费用进行核对,如果相符,则直接作为审计证据予以采用。

2.2.3 丰富的法律法规数据为工程审计提供依据

在工程项目实施过程中,会涉及到大量的法律法规。例如,在工程招投标中,会涉及到招投标相关的法律法规,通过各类的法律法规的数据,能够为审计人员开展具体的工程审计工作提供审计依据的支持。

2.2.4 盈利性机构的数据为工程审计提供分析性证据

工程项目在建设运营中,不可避免地与各种盈利性机构进行业务往来,这些盈利性机构也保存着业务往来的大量数据。工程审计人员可以利用这些盈利性机构的数据来判断被审计项目的真实性与效益性。

2.3 基于云服务的大数据为工程审计模式转变提供方法支持

云计算扩展了虚拟技术、分布式技术、并行技术等思想,为组织机构提供更具灵活性和扩展性的应用程序服务、资源存储服务和平台开发环境等云服务,几乎所有的信息资源,包括数据资源、应用程序、计算资源、存储资源和基础设施等都可以从云服务中获得。尽管云服务可能存在安全或者隐私隐患,但是云服务的快捷与高效不容错过。通过云服务,工程审计人员可以构建数据云,进而利用数据云的大量数据进行审计业务的开展与实施。

3 基于大数据与云服务的数据驱动审计模式建构

在大数据环境下,工程审计完全可以利用海量数据的优势,结合云计算的特点,构建新的数据驱动工程审计模式。

3.1 数据驱动工程审计模式的审计流程

在数据驱动工程审计模式下,审计活动并非以风险评估流程作为业务起点,而是根据工程审计的合法、真实以及效益作为审计目标,利用海量数据进行相关性分析,针对工程项目的全生命周期提出重点审计领域。在确定重点审计领域时,如果大数据能够对某些领域实施全覆盖,而且直接通过数据分析能够证明该领域不存在问题时,将直接得出审计结论,无需作为重点审计领域。在确定重点审计领域之后,采用主要审计程序,包括分析程序和视频监控程序,接下来采用进一步审计程序,即按照传统审计方法,进行风险评估程序、控制测试以及细节测试程序。具体如图1所示。

3.2 数据驱动工程审计模式构建

在数据驱动工程审计模式下,首先应当对数据进行整理形成各类型数据库,再利用回归模型等分析重点审计领域,在分析过程中,考虑工程项目不同生命周期的特点,针对重点审计领域采取必要的具体审计措施。

3.2.1 构建数据资源云

根据大数据构建数据资源云,形成工程审计资源数据库。第一类数据库是从行政机关和公共服务机构获取数据,包括工商行政管理机关的工商企业注册基本信息、税务机关的发票购销数量价格信息、统计机关的统计信息、财政机关的财政支出信息、国有企业财务信息以及自来水公司、电力公司燃气公司的水电气表行数、单价以及消耗量数据等等,这些数据来源权威,一般可以直接利用或者直接进行分析,在此基础上形成审计结论。第二类数据库是法律法规数据库。由于工程项目在建设过程中,涉及到诸如工程设计、工程施工的法律法规也比较多,而且关于工程审计乃至审计类的法律法规也比较多,可以构建工程审计法律法规数据库,方便审计人员查询使用。第三类数据库是混合型数据库,包括天气数据、交通数据、物价数据以及宏观经济运行状况的数据,审计人员在分析工程项目时,可以利用这些数据进行判断和分析。第四类数据库是工程人员自行上传的共享数据库。审计人员可以上传自己在审计过程中的经验以及进行审计判断时的依据及说明,包括一些重要的审计案例资源。这些系列的资源数据库为数据驱动工程审计模式的顺利实施提供良好的基础。

3.2.2 构建数据分析模型

即使再多的数据,没有科学的分析方法,数据亦无法发挥其应有的作用。因而,在数据库完善的基础上,构建数据分析模型,对大数据进行分析应用。数据分析的模型有多种,可以结合计量经济学的方法,构建回归模型。一般而言,可以构建一元回归模型,也可以构建多元回归模型,在此以多元回归模型为例,可以构建如下模型:

在这个模型中,Y是被解释变量,可以根据审计目标来确定具体的Y的变量设定,α0是截距项,X是解释变量,C是控制变量,εit是随即扰动项。

3.2.3 对工程项目进行全生命周期分析

从工程项目生命周期阶段来分析,工程审计应该包括工程项目决策阶段审计、工程项目勘察设计审计、工程项目招标投标审计、工程项目合同审计、工程造价审计、工程项目财务审计、工程项目绩效审计。在数据驱动工程审计模式下,在不同的工程项目周期阶段,审计的目标和重点各有不同。因而,利用构建的回归模型,针对不同的工程项目审计阶段,来确定模型的实际运用。以工程造价审计中的工程预算审计为例,在工程预算审计中,其中一个重要的审计目标是预算的真实性,即所编预算是否与施工图纸相一致。为了审查该项目标,则可以把预算真实率作为被解释变量,利用大数据来分析究竟哪些方面的原因影响到预算真实率,然后把显著的变量作为审计的重点领域。

3.2.4 利用分析程序和视频监控程序获取审计结论

根据注册会计师审计准则,分析程序是指注册会计师通过研究不同财务数据之间以及财务数据与非财务数据之间的内在关系,对财务信息作出评价。分析程序还包括调查识别出的、与其他相关信息不一致或与预期数据严重偏离的波动和关系。在工程审计中,分析程序则是根据需要审计的事情,结合大数据资料,查找被分析数据的内在联系,进而确定分析事项是否达到审计目标。

视频监控程序则是在大数据环境下采用的一项重要审计程序。在传统审计方法中,监盘是对确定存货存在性的较好的审计方法。但是在监盘的时候,要求审计人员必须在现场,监督盘点过程。在“审山审船审老天”的案例中,审计人员是无法监督水下的作业的,如果采用视频控制的方式,审计人员则可以在千里之外实时了解项目的进展情况。因而,审计人员可以采用在现场安装摄像设备,通过网络将视频数据实时传输到审计人员的电子终端,PC终端或者手机终端,审计人员能够监督工程项目的现场情况。

3.2.5 采用进一步审计程序获得审计结论

一般而言,采用分析程序和视频监控程序仍然无法获取充分适当的审计证据时,则需要进行进一步的审计程序,包括进行风险评估、控制测试以及细节测试。在采用进一步审计程序时,必须考虑到审计抽样的特点,在风险评估程序的基础上,确定审计风险的大小,并考虑内部控制的有效性,进而采取细节测试,最终获得审计结论。

参考文献

[1]赵庆华.工程审计[M].南京:东南大学出版社,2010.

上一篇:声像档案管理的重要性下一篇:光纤保护