一、大数据概念梳理
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
“大数据”(Big data)研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
二、大数据产业链、价值链介绍
大数据并非是在真空中产生的,其应用也不是断章取义的结果,大数据的应用实际上是在一个产业链中完成的,其价值是由有机相连的多个环节共同实现的,即数据从采集到存储,再到经过处理提取价值,最后被应用的整个过程,具体而言,大数据产业链主要包括数据采集、数据存储、数据处理和数据应用等环节。
图1:大数据产业链条
1、数据采集:数据采集环节是指对企业的内部经营数据、企业的内部管理数据和企业外部的用户行为数据等进行挖掘、整合的过程。
2、数据储存:数据存储环节是指将采集到的数据纳入到数据聚合平台中,方便数据的输入和输出。
3、数据处理:数据处理环节是指利用大数据技术对数据进行加工和分析,挖掘潜藏在数据中的深度信息,实现数据的增值。
4、数据应用:数据应用环节是指将处理好的数据产品应用到行业中去,为企业提供决策支持,从而提高运营效率。
这四个环节层层递进,贯穿整个数据生命周期过程。而根据大数据从产生到市场应用的发展环节,可将大数据产业链划分为“数据源”、“基础设施”、“软件系统”和“应用服务”等四个主体环节,并由“产业支撑”作为辅助环节。
图2:大数据价值链
1、数据源供应
数据源供应模式是指将源数据以库表、接口等形式提供给数据需求者,使其获得数据资产中所蕴含的价值,供应商根据数据需求量收费。该环节涵盖大数据产生的相关领域,包括传感终端、互联网、政府机关、运营商等。该环节主要是以数据为产品输出,相对简单,不涉及数据的分析处理,但信息安全的政策风险较高,而且市场空间有限,当前只适合于政府层面公共服务领域的数据源供应服务。
2、数据基础设施建设服务
基础设施供应是将大数据基础设施以交易的形式提供给政府、企业等需求者,支撑其从数据资源中获得丰富价值,具体服务内容包括IDC数据中心建设运维、“云计算”平台建设租赁、数据传输网络建设等。该环节主要是以大数据基础设施建设为服务输出,对于供应商的准入门槛相对较高。目前的市场发展已较为成熟,预计未来将呈平稳增长趋势,但不排除技术创新带来突破性增长的可能性。
3、数据软件技术服务供应支撑
软件系统供应是通过将大数据软件系统(Hadoop)以交易的形式提供给政府、企业等需求者,支撑其更好地管理数据资源并从中获取相应价值。具体服务内容包括基础软件系统服务和应用软件系统服务。基础软件系统是指为大数据的存储、管理、计算等提供基础运行环境,应用软件为满足应用需求提供支持。该环节主要是以大数据分析能力为产品输出,客户需求相对统一。
4、数据应用服务供应
数据应用服务模式是将大数据分析处理成果以服务的形式提供给政府、企业、公众等需求者,满足其现实应用需求,并帮助需求者获取更大的社会、经济价值。该模式是大数据应用服务层的主要商业模式之一,处于大数据产业链的顶端,用户群体最为广泛,需求最为丰富多样,基本涵盖了社会经济生活的所有主体,市场前景广阔。
5、产业支撑服务
产业支撑服务是指通过为大数据产业发展提供资金、技术、影响力等方面的支撑服务,以收入分成或服务佣金的形式获取收益。该环节主要是应用在辅助或推动大数据产业发展的相关领域,包括科研教育机构、创投孵化组织、行业咨询公司等。该层以提供大数据产业支撑服务为输出,不直接涉及大数据生产领域,但对大数据产业发展具有重要推动作用。
三、基于价值链的大数据产业商业模式
在大数据这个产业链中,不同环节的商业需求正在催生新的运作方式和盈利方法,从而引发新的商业模式。
1、数据自营模式
数据自营模式是指企业自身拥有海量数据和大数据技术,同时具备一定的分析能力,能够根据数据分析结果改进现有产品或预测未来,从而使企业获得利润的商业模式。
这种商业模式的成功运行是需要一定条件的:首先,数据来自公司内部,可以是生产经营信息或管理信息;其次,拥有先进的大数据技术,能够对信息进行充分的挖掘和提炼;再次,具备高效的分析能力,能够对数据分析结果进行准确评价;最后,具备数据决策能力。能根据分析结果进行商业决策,通过不断改进原有产品、推出新产品以及预测企业的发展方向使企业获得利润。
这种模式适用于综合实力较强的企业,基本上囊括了大数据产业链的各个环节,集数据生成、存储、处理和应用为一体,形成了良好的产业链循环体系。因其自产自销,不仅降低了成本,更适应企业的需求,使企业在大数据市场上占有一席之地。
案例:Facebook、亚马逊自身数据的生产、加工和消费。
2、数据租售模式
数据租售模式是通过一定的媒介,将广泛收集、精心过滤的数据销售或者租赁给客户来获取报酬的方式。这需要企业具有强大的收集数据和整合萃取信息的能力,以此形成数据采集、信息萃取、价值传递的完整链条。在这种商业模式下,数据实现了增值,成为可供交易的商品,很好的诠释了“数据就是资产”。
这种模式适用于拥有海量数据的企业。对他们而言,不用费很大的力气,只需对数据进行简单的加工便可获利。数据租售模式能使企业形成较强的差异性竞争力,使他们超越竞争对手。
案例:百度、网易的游戏数据挖掘与销售。
3、数据平台模式
数据平台模式是指数据的分析、分享和交易等功能都能通过平台来实现,通过为用户提供方便快捷的个性化平台服务来获取利润的商业模式。数据平台模式主要包括数据分析平台模式、数据分享平台模式和数据交易平台模式。
数据分析平台模式是指通过灵活租赁的方式为用户提供数据存储、数据运算和数据分析的平台服务。数据分析平台模式要求用户掌握一定的数据分析技能,用户只需将数据上传到平台上,便可使用平台上面的分析工具进行数据分析。
数据交易平台模式是指第三方平台提供商为数据所有者和需求者提供数据交换、交易的服务平台。数据交易平台模式需要完善的平台技术保证交易的顺利进行,数据的拥有者将数据上传到平台上,需求者便可从平台上下载。
数据分享平台模式是指平台服务商凭借其拥有的数据资产,为用户提供云数据库、数据推送、数据集成等服务,同时开放数据接口、提供开发环境,供开发者进行基于数据的应用开发从而获取利润分成。数据分享平台模式需要平台服务商具有强大的数据采集能力和分析能力,便可轻松运行。
数据平台模式适用于技术创新型企业,因其拥先进的平台技术,能够自如的利用平台进行数据处理和交易。由于这种模式是由技术驱动的,只要技术不断创新,未来将不可估量。
案例:Google的Big Query,阿里巴巴的“聚石塔”数据分享平台。
4、数据仓库模式
数据仓库模式是指通过整合所有类型的数据来为企业提供决策支持,从而达到获利目的的商业模式。这类公司通常具备决策支持工具和高素质的分析人才,目的是为企业提供分析性报告和决策支持,帮助企业实现智能化改进业务流程和监视时间、成本、质量和控制。这种模式适用于决策型企业,帮助用户快速的做出正确的决策,实现投资回报率的最大化。
案例:Teradata(天睿公司)。
5、数据众包模式
众包是指企业在线发布问题—大众群体(专业或非专业)提供解决方案—为赢者获取报酬,且其知识成果归企业所有,是一种在线、分布式问题的解决模式和生产模式。而数据众包模式是从大数据的角度出发,指企业从创新设计领域切入,将产品设计转向用户,通过搜集消费者设计的海量数据,进行数据测评找到最佳的产品设计,同时借助社会资源提升自身的创新与研发实力。
这要求企业拥有一定的创新能力和研发技术。这种商业模式适用于创新驱动型企业。其核心是用户创造数据,优势在于强调了社会的差异性、多元性带来的创新潜力。因其倚重“草根阶层”,大大的降低了企业运营成本,还能使产品更具创造力和适应性。
案例:美国“无线(Threadless)T 恤公司”,宜家通过举办“天才设计”大赛。
6、数据外包模式
外包是指在企业为获取竞争优势,把除核心资源以外的其他资源借助于外部最优秀的专业化资源予以整合,达到降低企业成本、提高绩效、提升企业核心竞争力和增强企业对环境应变能力的一种管理模式。而数据外包模式是指企业将数据收集、数据处理等业务环节剥离出来,外包给专业机构,通过优化资源配置,降低成本增强核心竞争力。数据外包模式主要包括决策外包和技术外包。这种模式要求企业拥有一定的知识背景、先进的大数据技术和卓越的分析应变能力,能够游刃有余的解决各种类型企业的决策问题和技术问题。
这种商业模式适用于经验型企业,它的优势不仅在于帮助用户缩短决策周期、缩减业务流程,更重要的是降低运营成本,可以使用户集中精力做核心业务,不断增强其核心竞争力。
案例:影研科技,Facebook。