大数据不仅仅是一个营销词汇,在这篇干货满满的文章里,作者用数据告诉我们,究竟什么是大数据,大数据行业的创业机会如何,未来的创业方向又有哪些。
接触大数据,了解这个行业已经有两年多了,每天都在阅读大量的关于大数据的文献资料和技术文章。如果你要问我什么是大数据?以前可能我会和你说,大数据是一种思维,一种技术,标志的是大数据的4V特点:
Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据带来的是一种变革,打破了原有的随机分析(抽样调查)方法,采用所有全量的数据来进行分析,分析的数据更加复杂,有结构化数据、半结构化数据和非结构化数据,分析结构更加注重相关性而不是因果。
可是,普通人和大众用户他们听得懂吗?现在我会举例子告诉你。
比如说,采野蘑菇/野山参这样的事情,野蘑菇和野山参的分布地点都是随机的,经验告诉我,它们会分布在哪片山林,但是我们不知道具体位置,得一个一个的找。大数据可以解决这个难题。
我们可以把山林用数据可视化表现出来,然后让采野蘑菇的人根据自己的实战经验标出蘑菇分布的地点,并且把这些地点数据常年积累起来。然后结合野蘑菇的习性,收集每片山林的降雨量、灌木丛分布数据、土壤数据、温度数据以及山林里采蘑菇的人流量数据等等,来准确的预测出野蘑菇的分布地点。
这就是大数据力量。
一言以蔽之,大数据最直接的意义就是让“随机性”的事情变得可提前预测,从而提高效率和行动价值。
同样的思路,森林防火防贼、环境保护、旅游景点客流预测等等,都可以引入大数据思维。大数据同时也可以为我们工作、学习和生活中一些重大决策作为依据。
今天主要说的是大数据领域的创业思考,大数据只有和生活、学习、工作以及商业等场景结合才能产生价值。推动技术发展的从来都不是技术本身,而是消费者(用户)的需求。用户不需要知道也没兴趣知道你处理大数据是用Hadoop还是Spark、原理是什么、架构是什么,用户最关心的是大数据到底怎么用,用了能为自己带来什么好处。
今天我们将从“外部大环境”、“行业内部环境”、“创业风险”和“大数据创业机会和方向”四个点来阐述主题,聪明的朋友也许已经知道了,我们的思路就是大数据领域创业的SWOT分析。
大数据市场现状(外部环境)
根据贵阳大数据交易所5月28日发布的《2015年中国大数据交易白皮书》显示:2014年中国大数据市场规模达到767亿元,同比增长27.83%。预计到2020年,中国大数据产业市场规模将达到8228.81亿元。
一、大数据市场规模巨大
首先,中国大数据市场环比增长率较大。根据易观智库7月30号发布的中国大数据应用行业的报告显示,2015-2018年中国大数据市场营销规模达到258.6亿人民币。环比增长率为37.2%。
其次,大数据在全球范围内的市场规模同样巨大,根据IDC发布最新研究结果,预测到2018年全球大数据技术和服务市场的2018年的复合年增长率将达到26.4%,规模达到415亿美元,是整个IT市场增幅的6倍。
无论是从国内还全球的市场规模和增长率来看,我们都可以得出这样一个结论,无论你是什么样的公司,或者说你未来创业要做什么样的服务,大数据都是兵家必争之地。大数据本身就是一种无形的资产,如果你的公司还没有部署大数据,那么在未来的市场上会失去核心竞争力。就好比你走在中关村创业大街上,你能收到的100份融资BP里,可能有99份都是APP和O2O项目,但99家里90%以上会重视大数据。
二、政策好,政府支持力度大
根据gov.cn 9月6日消息,国务院公开发布《国务院关于印发促进大数据发展行动纲要的通知》,纲要里明确的说明,中国将在2018年会建成政府的大数据平台。相比之下,我们敬爱的习大大和李克强总理也经常为大数据站台,为中国的大数据发展点赞。看政府对大数据的重视,你抬头看看前两天的北京的蓝天,就会对政府有信心了。政府真正要干一件事,执行力大的超出你的预期。
据我们的观察,大数据领域的创业环境只会越来越好。目前,很多一线城市乃至二三线城市的科技园区,都出台了相关的扶持大数据产业的政策。如果你真的想在这个行业创业,可选择扶持力度大、人才较多的城市作为大本营,当然了,北京肯定是首选。
三、资本关注热
上图是我们对大数据垂直领域2015年资本投资事件的不完全统计。其实你仔细来看图会发现,大数据行业的资本关注热度是远远高于其他行业的。这个可以从投资金额可以看出来。今年上半年O2O项目非常热,也是投资重点关注的行业,但是投资的资本里,普遍都是人民币几百万和几千万这样的量级。而大数据行业的投资,更多的资本量级都是上亿的,而且资本多源于顶级投资机构。
大数据行业现状(内部环境)
“大数据就像十几岁少年眼中的性行为,每个人都在谈论它,但没人真正知道怎么做。每个人都以为除了自己之外的每个人都在使用它,所以每个人都装作自己很了解它。”
TED的创始人Dan Ariely是这样调侃大数据的。虽然是句玩笑话,但也确实说出了大数据的行业现状。
现状一、市场尚未饱和,竞争并不激烈
1、尚未出现垄断性行业巨头
前面我们分析了大数据整个大环境的状况,我们知道大数据行业市场潜力巨大,未来的增长率将达37%左右。但是在中国,目前尚未出现一家如Palantir、FICO这样的垄断性质的大数据企业。也许百分点和Talkingdata都在布局上市,但是距离挂牌还有一段时间和距离。新创的大数据企业中,还没有一家在美股、港股和深交所上市。
这是一个机会。创业你做电子商务也好,做游戏也好,都有好几家有钱有用户的巨头公司和你争抢市场份额,但是大数据行业不一样,大数据行业没有那么大的竞争压力,而且真正的战争尚未开始。
2、现有大数据企业扎推北京
根据数据堂统计的数据来看,新创的大数据企业中,57%的公司都在北京,上海占了15%的份额。大数据需要和实际的业务场景结合才能产生价值,工业、农业、制造、交通和能源等传统行业仍然拥有巨大的潜力,北上广深和二三线城市的大数据力量还没有完全被挖掘出来,这同样也是一个优势。
3、大数据在生活、商业渗透性较弱
笔者做大数据两年了,天天都听到或看到大数据的各种消息,但是生活并没有因为大数据的到来变得更智能一些。它没有让大龄光棍女青年更快更精准的找到结婚对象,也没用让隔壁老王炒股赚到更多的钱,更没有让北京的交通不再拥堵……大数据有用是不假,但是和生活场景结合得还是较弱。并没有看到可以称之为“变革”的现象。
4、没有直接的变现模式
互联网上最赚钱的两大行业分别是电子商务和网络游戏,这两个行业的变现模式都是非常清晰和直接的,但是大数据的变现模式需要绕一个弯子,需要和实际业务场景结合起来才能产生价值,不直接的路定然不好走。
有人曾经把大数据比作石油,可是,目前的情况看来,大数据行业还需要像发动机一样可以将数据转化成动力的载体。一如2010年以前一样,大家都知道手机游戏是未来的一个趋势,可是没有iPhone等智能移动设备的出现,手机游戏的市场份额就非常小,用户体量也很有限。
现状二、大数据行业人才紧缺
根据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。2015年-2016年是大数据人才最为匮乏的两年,因为已开了大数据专业的高等院校,第一批大数据人才还为毕业;已有的人才里,复合型的人才较少,都是术有专攻。
全球的大数据人才情况也不容乐观,据Gartner预测,到2016年,25%的全球大型企业将部署大数据分析系统;到2015年,圈球大数据人才需求将达到440万人;调查结果表明,全球64%的企业已经开始向大数据项目注资,或者打算在2015年6月之前将计划付诸实践。
大数据创业,人才就是核心,所有的公司都在抢大数据人才,创业公司想要招到相应的大数据人才非常困难。
现状三、数据量增长超快
这里和大家分享三个数字。49亿、250亿和39ZB。
49亿物联网设备:咨询公司Gartner预测今明两年互联物品的涨幅将达30%。分析师在指出,截止到2015年,全球物联网设备数量将从38亿飙升至49亿。
250亿智能装置传感器:分析师预测,传感器的普及将大大加速智能设备的开发、生产进度。到2020年,将会有大约250亿部智能装置出现在全球市场。
39ZB数据存储量:在2014年年底,国内网络上集中存储的数据已经达到1ZB,到2020年时,当年的新增数据量将会达到15.45ZB,整体的网络上数据存储量将会达到39ZB,未来6年的年复合增长率达到了84%。
预测到2020年,平均每个中国人每年产生的数据约为4.1GB。
现状四:行业目前存在问题
1、炒作过剩,实际落地产品较少;很多产品都是打擦边球;把大数据玩坏了。现在你和大家说大数据,很多人都认为你在骗人。行业想要持续稳定的发展,企业必须有自律。
2、群众基础差,关注的人群多为三高人才,高学历高收入和高技术。从百度指数可以看出,关注大数据的人群中,53%比例的人群年龄分布为30-39岁,而20-29岁人群占的比例为28%;另外,关注大数据的男女比例里,男性占到了80%以上。这样的数字直接告诉我们的问题就是,“大数据”的话题传播性其实并不好。预计超过90%的大众用户不知道大数据是个什么东西。
3、大数据只解决了部分2B的问题,2C产品较少。现在大家都觉得大数据的方向就是2B,我们不这么认为。打个比方说,你做2B的产品,每家企业平均给你200万,新创大数据企业你撑死了一年做上20家企业,那么营收预计在4000万左右。但是如果你做2C的大数据产品,一个用户给你200块,当你做到20万付费用户的时候,你的营收就会超过4000万。为什么呢,因为用户的数据本身就是钱。从深远的角度来说,未来的创业,你必须学会讨好大众,服务好90后,这才是种子用户。
4、懂技术的人不懂业务,懂业务的人不懂商业。这一点不想做详细的说明,打击面太广了。笔者参加了众多大数据行业内的峰会大会小会,人人都在说大数据,可是问到你的业务如何赚钱的时候,很多人都是三缄其口。纯技术是无法赚钱的,必须和实际的业务结合起来产生商业价值,才能获益。
5、市面上存在的大数据工具上手门槛较高。又一个槽点出来了。前面也说了,任何的新技术,都是需求推动其发展。需求来自用户。任何的新技术,只有拥抱大众用户才能得到更好的发展,接地气非常重要。现有的大数据处理工具非常复杂,需要你懂这个那个会这个那个才能使用,大众根本接触不到。现有的大数据工具也不够亲民,无论是2B也好,2C也好,你需要给别人的是一个简单动动手就能用的工具,里面有功能按钮,而不是一堆代码,最起码应该满足目前Office工作人员使用。上手门槛较高意味着很大一部分用户被你挡在了门外。将大数据处理工具产品化势在必行。
大数据行业创业的风险预警
一、大数据的创业门槛
1、人才成本较高;在美国,在R、NoSQL和MapReduce方面需求的专业人才薪水达到了每年约11万5千美元,在中国,大数据人才一将难求,创业公司不容易招大数据技术人才,即使招到,人才方面支出也较高。包括高薪、期权和股票等等;
2、存储硬件成本高;考虑到数据归属和安全性。大数据公司一般不会数据存在云上。自建机房比云存储成本高很多倍。
3、项目启动资金高;不是30-50十万就可以玩起来的,比移动互联网APP创业项目启动资金要求高。
4、用户少、获取成本高。这一点的门槛主要是群众基础差带来的。
没有明确的商业变现模式,这是目前大数据创业的最大门槛。拼数据,你拼不过阿里百度腾讯,拼钱,还是算了……
二、数据安全问题
据Verizon发布的《2015年数据泄露调查报告》显示,79790个安全事件中已有2122个确认的数据泄露。值得关注的是在2015年的报告中新增了一个统计模型,用以帮助企业评估到底每笔数据泄露,要损失多少钱。如果泄露1000条记录时,有95%的可能会损失5.2万-8.7万。泄露1千万数据记录的花费介于210万到520万之间,但最多可能到7390万。
让我们来回顾一下近年来数据泄漏的事件:2014年5月,800万小米用户数据或被泄露;2014年12月,12306大量用户信息遭泄露;2015年4月,超30省市曝管理漏洞数千万社保用户信息或泄露;2015年5月,携程网全面瘫痪疑似数据库物理删除;2015年6月,美国人事管理局(OPM)被指出大量工作人员信息泄露;2015年8月,婚外情网站AshleyMadison数据遭泄露……
对于大数据新创企业来说,数据的安全性就是“命”,如何保命事关生存。大数据的安全性,是部署大数据架构和大数据创业最大的挑战之一!
三、大数据隐私
关于大数据隐私,在美国有隐私法案,而且美国与欧盟之间还签署了安全港、隐私声明等等。而在中国,目前的立法是非常模糊的,属于灰色地带。手机号码被恶意第三方收集了,然后给用户发了很多垃圾短信,或者我的姓名,我的电话,我的邮箱,他们收集我的信息是不是合法的,目前这一点在在立法上都不清晰。不知道未来国家会不会出台相关的法律法规来规范这个领域?大数据隐私目前具有不确定因素,也是创业存在的风险之一。
说完了风险,下面我们可以来说说大数据行业的创业方向和机会。
大数据行业创业机会与方向
一、资本层面关注点
对于大数据项目,投资人到底看什么?在写这篇文章之前,我们与多家投行的投资人曾经做过访谈,下面是我们根据访谈内容整理出来的内容。
大数据没有直截了当的变现模式,那么一个新创大数据企业想要获得成功,拿什么去拼?当然是人才。这也是投资人最关注的东西。
投资人告诉笔者,对于一个大数据项目,他们最看重的是团队。那怎么看团队呢?一般从团队技术能力、背景、过往项目经验和创始人四个方面来看。大数据对技术的要求非常高,投资人看项目的时候,首先看的就是创始人的技术能力。一般情况下,投资者会更加青睐拥有技术背景的创始人和他的项目。
还有就是看项目的商业模式和变现能力。看项目方面,投资人会去看你的项目对应的国外成熟企业,或者说你的项目对应的竞争者是谁。由竞争者经营的情况来预估你在其领域的市场份额和变现能力。商业模式方面,投资者会看你的客户(用户)体量和数据源。你的客户群体有多大?你手里有哪些具体业务上的数据?这些数据如何产生价值,应用到你的客户身上?解决好这3个问题就成功了一半。
大数据项目变现方向,投资人关注的是你的项目是否能够快速直接的产生价值,而且有持续的创收能力。
解决好以上几个问题,新创大数据公司想要拿到融资就非常容易了。
二、大数据垂直领域热门的投资方向
第一个是Hadoop商业化,简单来说就是做Hadoop的收费版本。Hadoop本来是开源的,但是在具体业务场景中,还缺乏很多功能,那么Hadoop商业化就是去完善这些功能,使其更好的应用于企业的业务场景。Hadoop商业化最典型的公司就是Hadoop的三驾马车,Hortonworks,Cloudera和MapR,Hortonworks目前已经在纳斯达克上市。中国相应的做Hadoop商业化的公司是星环科技。
第二个是SQLonHadoop,用大白话来说就是基于应用场景下的数据框架。比如说大数据架构里的查询引擎、存储引擎、计算模型等等,这个主要是基于大数据技术方向的,比如说WibiData,它提供了对Hadoop的封装,连接前端应用到Hadoop基础设施。
第三个是NoSQL数据库,非关系型数据库和云数据库服务。典型的国外企业有MongoDB和Datastax。目前,创业公司MongoDB的估值已超过16亿美元,而在中国,基础云服务商青云QingCloud已经推出了基于MongoDB的集群服务,名字叫做青云QingCloudMongoDB。
第四个是分析和可视化。对应的国外企业有Tableau、Datameer。国内新创的大数据企业中,也有很多大数据企业在做可视化服务,比如说国云数据的大数据魔镜。
第五个是行业大数据应用。为社交媒体、广告公司、企业客户、电子商务等行业客户提供数据分析,帮助这些行业提升数据分析的水平,如DataSift、RelateIQ、RocketFuel等创业公司。
三、大数据行业现有的商业模式
谈到商业模式,肯定就要说到2B还2C的问题。
2B是目前大数据行业主要的商业模式,将大数据变为一种服务,服务的对象是企业或机构。比如现有的大数据企业里,星图数据,Hortonworks,Cloudera,星环科技、Talkingdata都是2B的商业模式。从他们的运营状况,不难看出,2B的商业模式,要么是做解决方案(类似外包),要么就是做工具。
预计未来所有的互联网企业也好,传统企业也好,都会在企业内部成立大数据部门,那么到那个时候,解决方案的市场份额还会多么?不肯到也不否定。对于一家企业来说,大数据就是自己的资产,相信企业更倾向于自己管理自己的内部资产。所以我们大胆的预测,解决方案只是目前大数据行业的权宜之计,未来企业会用自己的人才管理自己的大数据,用自己的人才使用自己的大数据。做工具是目前较为主流的模式。Palantir其实也是做工具。
2C方面,在整理这份内容的时候,我们发现2C的产品非常少。女性经期助手、百度指数这样勉强算是2C的大数据产品。而大数据2C方面的产品,更多的是倾向于应用。可穿戴设备其实也算是大数据应用产品之一。
说了这么多,你肯定会问我了,那么腾讯、百度和阿里巴巴这样的企业,他们的大数据又是什么样的模式呢?在笔者看来,BAT企业的大数据商业模式都是2C+2B的模式,我们可以简称为复合型的商业模式,因为他们服务的用户有企业用户也有个人用户。
总结一下,现有的商业模式里,哪个?笔者个人认为是2B+2C模式。这样的模式是最健康的模式,形成了一个商业闭环。
用一句话来说就是:你收集用户的数据,分析出报告,然后给到的对应的企业,对应的企业根据数据反馈,从而开发或制造出更好的产品,让用户享受更智能更美好的生活。这整个过程中,大数据是贯穿始终的。