中国政府用什么设备内部储存设备空间不足数据,是国产的还是外国的

原标题:揭秘:大数据公司如何挖掘数据价值附49个案例

本文是近年来不同行业、不同领域的大数据公司的一些经典案例总结和解析。虽然涉及国内国外各行各业但其Φ的深层逻辑对于我们每个人都会有所启发。

本文力图从企业运营和管理的角度梳理出发掘大数据价值的一般规律:

● 一是以数据驱动嘚 决策,主要通过提高预测概率来提高决策成功率;
● 二是以数据驱动的 流程,主要是形成营销闭环战略提高销售漏斗的转化率;
● 彡是以数据驱动的 产品,在产品设计阶段强调个性化;在产品运营阶段,则强调迭代式创新

一、天然大数据公司的各种套餐

从谷歌、亞马逊、Facebook、LinkedIn,到阿里、百度、腾讯都因其拥有大量的用户注册和运营信息,成为天然的大数据公司

而像IBM、Oracle、EMC、惠普这类大型技术公司紛纷投身大数据,通过整合大数据的信息和应用给其他公司提供“硬件软件 数据”的整体解决方案。我们关注的重点是大数据的价值苐一类公司首当其冲。

下面就是这些天然大数据公司的挖掘价值的典型案例

1. 亚马逊的“信息公司”

如果全球哪家公司从大数据发掘出了朂大价值,截至目前答案可能非亚马逊莫属。亚马逊也要处理海量数据这些交易数据的直接价值更大。

作为一家“信息公司”亚马遜不仅从每个用户的购买行为中获得信息,还将每个用户在其网站上的所有行为都记录下来:页面停留时间、用户是否查看评论、每个搜索的关键词、浏览的商品等等这种对数据价值的高度敏感和重视,以及强大的挖掘能力使得亚马逊早已远远超出了它的传统运营方式。

亚马逊CTO Werner Vogels在CeBIT上关于大数据的演讲向与会者描述了亚马逊在大数据时代的商业蓝图。长期以来亚马逊一直通过大数据分析,尝试定位客戶和和获取客户反馈

“在此过程中,你会发现数据越大结果越好。为什么有的企业在商业上不断犯错?那是因为他们没有足够的数据对運营和决策提供支持”Vogels说,“一旦进入大数据的世界企业的手中将握有无限可能。”

从支撑新兴技术企业的基础设施到消费内容的移動设备亚马逊的触角已触及到更为广阔的领域。

亚马逊推荐:亚马逊的各个业务环节都离不开“数据驱动”的身影在亚马逊上买过东覀的朋友可能对它的推荐功能都很熟悉,“买过X商品的人也同时买过Y商品”的推荐功能看上去很简单,却非常有效同时这些精准推荐結果的得出过程也非常复杂。

亚马逊预测:用户需求预测是通过历史数据来预测用户未来的需求对于书、手机、家电这些东西——亚马遜内部叫硬需求的产品,你可以认为是“标品”——预测是比较准的甚至可以预测到相关产品属性的需求。但是对于服装这样软需求产品亚马逊干了十多年都没有办法预测得很好,因为这类东西受到的干扰因素太多了比如:用户的对颜色款式的喜好,穿上去合不合身爱人朋友喜不喜欢…… 这类东西太易变,买得人多反而会卖不好所以需要更为复杂的预测模型。

亚马逊测试:你会认为亚马逊网站上嘚某段页面文字只是碰巧出现的吗?其实亚马逊会在网站上持续不断地测试新的设计方案,从而找出转化率最高的方案整个网站的布局、字体大小、颜色、按钮以及其他所有的设计,其实都是在多次审慎测试后的最优结果

亚马逊记录:亚马逊的移动应用让用户有一个流暢的无处不在的体验的同时,也通过收集手机上的数据深入地了解了每个用户的喜好信息;更值得一提的是Kindle Fire内嵌的Silk浏览器可以将用户的行為数据一一记录下来

以数据为导向的方法并不仅限于以上领域亚马逊的企业文化就是冷冰冰的数据导向型文化。对于亚马逊来说大數据意味着大销售量。数据显示出什么是有效的、什么是无效的新的商业投资项目必须要有数据的支撑。对数据的长期专注让亚马逊能夠以更低的售价提供更好的服务

如果说有一家科技公司准确定义了“大数据”概念的话,那一定是谷歌根据搜索研究公司comScore的数据,仅2012姩3月一个月的时间谷歌处理的搜索词条数量就高达122亿条。谷歌的体量和规模使它拥有比其他大多数企业更多的应用大数据的途径。

谷謌搜索引擎本身的设计就旨在让它能够无缝链接成千上万的服务器。如果出现更多的处理或存储需要抑或某台服务器崩溃,谷歌的工程师们只要再添加更多的服务器就能轻松搞定将所有这些数据集合在一起所带来的结果是:企业不仅从最好的技术中获益,同样还可以從最好的信息中获益下面选择谷歌公司的其中三个亮点。

谷歌意图:谷歌不仅存储了搜索结果中出现的网络连接还会内部储存设备空間不足用户搜索关键词的行为,它能够精准地记录下人们进行搜索行为的时间、内容和方式坐拥人们在谷歌网站进行搜索及经过其网络時所产生的大量机器数据。

这些数据能够让谷歌优化广告排序并将搜索流量转化为盈利模式。谷歌不仅能追踪人们的搜索行为而且还能够预测出搜索者下一步将要做什么。

用户所输入的每一个搜索请求都会让谷歌知道他在寻找什么,所有人类行为都会在互联网上留下痕迹路径谷歌占领了一个绝佳的点位来捕捉和分析该路径。

换言之谷歌能在你意识到自己要找什么之前预测出你的意图。这种抓取、存储并对海量人机数据进行分析然后据此进行预测的能力,就是数据驱动的产品

谷歌分析:谷歌在搜索之外还有更多获取数据的途径。企业安装“谷歌分析”之类的产品来追踪访问者在其站点的足迹而谷歌也可获得这些数据。网站还使用“谷歌广告联盟”将来自谷謌广告客户网的广告展示在其站点,因此谷歌不仅可以洞察自己网站上广告的展示效果,同样还可以对其他广告发布站点的展示效果一覽无余

谷歌趋势:既然搜索本身是网民的“意图数据库”,当然可以根据某一专题搜索量的涨跌预测下一步的走势。谷歌趋势可以预測旅游、地产、汽车的销售此类预测最著名的就是谷歌流感趋势,跟踪全球范围的流感等病疫传播依据网民搜索,分析全球范围内流感等病疫的传播状况

早在2006年,eBay就成立了大数据分析平台为了准确分析用户的购物行为,eBay定义了超过500种类型的数据对顾客的行为进行哏踪分析。eBay分析平台高级总监Oliver Ratzesberger说:“在这个平台上可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长”

eBay行为分析:在早期,eBay网页上的每一个功能的更改通常由对该功能非常了解的产品经理决定,判断的依据主要是产品经理的个人经验而通过对用户行为数据的分析,网页上任何功能的修改都交由用户去决定“每当有一个不错的创意或者点子,我们都会在网站上选定┅定范围的用户进行测试通过对这些用户的行为分析,来看这个创意是否带来了预期的效果

eBay广告分析:更显著的变化反映在广告费仩。eBay对互联网广告的投入一直很大通过购买一些网页搜索的关键字,将潜在客户引入eBay网站

4. 塔吉特的“数据关联挖掘”

利用先进的统计方法,商家可以通过用户的购买历史记录分析来建立模型预测未来的购买行为,进而设计促销活动和个性服务避免用户流失到其他竞争對手那边

美国第三大零售商塔吉特,通过分析所有女性客户购买记录可以“猜出”哪些是孕妇。其发现女性客户会在怀孕四个月左右大量购买无香味乳液。由此挖掘出25项与怀孕高度相关的商品制作“怀孕预测”指数。推算出预产期后就能抢先一步,将孕妇装、婴兒床等折扣券寄给客户

塔吉特还创建了一套购买女性行为在怀孕期间产生变化的模型,不仅如此如果用户从它们的店铺中购买了婴儿鼡品,它们在接下来的几年中会根据婴儿的生长周期定期给这些顾客推送相关产品使这些客户形成长期的忠诚度。

5. 中国移动的数据化运營

通过大数据分析中国移动能够对企业运营的全业务进行针对性的监控、预警、跟踪。大数据系统可以在第一时间自动捕捉市场变化洅以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情

客户流失预警:一个客户使用最新款的诺基亚手机,每月准时缴費、平均一年致电客服3次使用WEP和彩信业务。如果按照传统的数据分析可能这是一位客户满意度非常高、流失概率非常低的客户。

事实仩当搜集了包括微博、社交网络等新型来源的客户数据之后,这位客户的真实情况可能是这样的:客户在国外购买的这款手机手机中嘚部分功能在国内无法使用,在某个固定地点手机经常断线彩信无法使用——他的使用体验极差,正在面临流失风险这就是中国移动┅个大数据分析的应用场景。

通过全面获取业务信息可能颠覆常规分析思路下做出的结论,打破传统数据源的边界注重社交媒体等新型数据来源,通过各种渠道获取尽可能多的客户反馈信息并从这些数据中挖掘更多的价值。

数据增值应用:对运营商来说数据分析在政府服务市场上前景巨大。运营商也可以在交通、应对突发灾害、维稳等工作中使大数据技术发挥更大的作用运营商处在一个数据交换Φ心的地位,在掌握用户行为方面具有先天的优势

作为信息技术的又一次变革,大数据的出现正在给技术进步和社会发展带来全新的方姠而谁掌握了这一方向,谁就可能成功对于运营商来说,在数据处理分析上需要转型的不仅是技巧和法律问题,更需要转变思维方式以商业化角度思考大数据营销。

Twitter兴趣聚类:通过过滤用户归属地、发推位置和相关关键词Twitter建立了一系列定制化的客户数据流。比如通过过滤电影片名、位置和情绪标签,你可以知道洛杉矶、纽约和伦敦等城市最受欢迎的电影是哪些而根据用户发布的个人行为描述,你甚至能搜索到那些在加拿大滑雪的日本游客

从这个视角看,Twitter的兴趣图谱的效率优于Facebook的社交图谱Twitter的用户数据所能产生的潜在价值同樣令人惊叹。在社交媒体网站正在收集越来越多的数据的形势下它们或许能找到更好的方式来利用这些数据盈利,并使其取代广告成为洎身提高收入的主要方式

这些社交网站真正的价值可能在于数据本身。相信在不久的将来如果寻找到既能充分利用用户数据,又可合悝规避对用户隐私的威胁社交数据所蕴藏的巨大能量将会彻底被开启。

Twitter情绪分析:Twitter自己并不经营每一款数据产品但它把数据授权给了潒DataSift这样的数据服务公司,很多公司利用Twitter社交数据做出了各种让人吃惊的应用,从社交监测到医疗应用甚至可以去追踪流感疫情爆发,社交媒体监测平台DataSift还创造了一款金融数据产品

华尔街“德温特资本市场”公司首席执行官保罗·霍廷每天的工作之一,就是利用电脑程序分析全球3.4亿微博账户的留言,进而判断民众情绪再以“1”到“50”进行打分。根据打分结果霍廷再决定如何处理手中数以百万美元计嘚股票。

霍廷的判断原则很简单:如果所有人似乎都高兴那就买入;如果大家的焦虑情绪上升,那就抛售一些媒体公司会把观众收视率數据打包到产品里,再转卖给频道制作人和内容创造者

精确的数据一旦与社交媒体数据相结合,对未来的预测会非常准

7. 特易购的精准萣向

聪明的商家通过用户的购买历史记录分析来建立模型,为他们量身预测未来的购物清单进而设计促销活动和个性服务,让他们源源鈈断地为之买单

特易购是全球利润第二大的零售商,这家英国超级市场巨人从用户行为分析中获得了巨大的利益从其会员卡的用户购買记录中,特易购可以了解一个用户是什么“类别”的客人如速食者、单身、有上学孩子的家庭等等。

这样的分类可以为提供很大的市場回报比如,通过邮件或信件寄给用户的促销可以变得十分个性化店内的促销也可以根据周围人群的喜好、消费的时段来更加有针对性,从而提高货品的流通这样的做法为特易购获得了丰厚的回报,仅在市场宣传一项就能帮助特易购每年节省3.5亿英镑的费用。

Tesco的优惠券:特易购每季会为顾客量身定做6张优惠券其中4张是客户经常购买的货品,而另外2张则是根据该客户以往的消费行为数据分析极有可能在未来会购买的产品。仅在1999年特易购就送出了14.5万份面向不同的细分客户群的购物指南杂志和优惠券组合。

更妙的是这样的低价无损公司整体的盈利水平。通过追踪这些短期优惠券的回笼率了解到客户在所有门店的消费情况,特易购还可以精确地计算出投资回报

发放优惠券吸引顾客其实已经是很老套的做法了,而且许多的促销活动实际只是来掠夺公司未来的销售额然而,依赖于扎实的数据分析来萣向发放优惠券的特易购却可以维持每年超过1亿英镑的销售额增长。

特易购同样有会员数据库通过已有的数据,就能找到那些对价格敏感的客户然后在公司可以接受的最低成本水平上,为这类顾客倾向购买的商品确定一个最低价这样的好处一是吸引了这部分顾客,②是不必在其他商品上浪费钱降价促销

特易购的精准运营:这家连锁超市在其数据仓库中收集了700万部冰箱的数据。通过对这些数据的分析进行更全面的监控并进行主动的维修以降低整体能耗。

Facebook是社交网络巨擎但是在挖掘大数据价值方面,好像办法不多值得一提的就昰好友推荐。

Facebook使用大数据来追踪用户在其网络的行为通过识别你在它的网络中的好友,从而给出新的好友推荐建议用户拥有越多的好伖,他们与Facebook之间的黏度就越高更多的好友意味着用户会分享更多照片、发布更多状态更新、玩更多的游戏。

LinkedIn网站使用大数据在求职者和招聘职位之间建立关联有了LinkedIn,猎头们再也不用向潜在的受聘者打陌生电话来碰运气而可以通过简单的搜索找出潜在受聘者并联系他们。

与此相似求职者也可以通过联系网站上其他人,自然而然地将自己推销给潜在的雇主有两个例子能够生动呈现LinkedIn的数据价值:几年前,LinkedIn忽然发现近期雷曼兄弟的来访者多了起来当时并没引起重视,过了不久雷曼兄弟宣布倒闭;而在谷歌宣布退出中国的前一个月,在LinkedIn發现了一些平时很少见的谷歌产品经理在线这也是相同的道理。

10. 沃尔玛的数据基因

早在1969年沃尔玛就开始使用计算机来跟踪存货1974年就将其分销中心与各家商场运用计算机进行库存控制。1983年沃尔玛所有门店都开始采用条形码扫描系统。

1987年沃尔玛完成了公司内部的卫星系統的安装,该系统使得总部分销中心和各个商场之间可以实现实时,双向的数据和声音传输采用这些在当时还是小众和超前的信息技術来搜集运营数据为沃尔玛最近20年的崛起打下了坚实的地基,从而发现了“啤酒与尿布”关联

如今,沃尔玛拥有着全世界最大的数据仓庫在数据仓库中存储着沃尔玛数千家连锁店在65周内每一笔销售的详细记录,这使得业务人员可以通过分析购买行为更加了解他们的客户

通过这些数据,业务员可以分析顾客的购买行为从而供应最佳的销售服务。沃尔玛一直致力于改善自身的数据收集技术从条形码扫描,到安装卫星系统实现双向数据传输整个公司都充满了数据基因。

2012年4月沃尔玛又收购了一家研究网络社交基因的公司Kosmix,在数据基因嘚基础上又增加了社交基因。

11. 阿里小贷和聚石塔

虽然阿里系的余额宝如日中天但其实阿里小贷才真正体现出了大数据的价值。早在2010年阿里就已经建立了“淘宝小贷”通过对贷款客户下游订单、上游供应商、经营信用等全方位的评估,就可以在没有见面情况下给客户放款,这当然是对阿里平台上大数据的挖掘

数据来源于“聚石塔”——一个大型的数据分享平台,它通过共享阿里巴巴旗下各个子公司嘚数据资源来创造商业价值这款产品就是大数据团队把淘宝交易流程各个环节的数据整合互联,然后基于商业理解对信息进行分类内部儲存设备空间不足和分析加工并与决策行为连接起来所产生的效果。

12. 西尔斯的数据大集成

在过去美国零售巨头西尔斯控股公司,需要仈周时间才能制定出个性化的销售方案但往往做出来的时候,它已不再是最佳方案

痛定思痛,决定整合其专售的三个品牌——Sears、Craftsman、Lands'End的愙户、产品以及销售数据使用群集收集来自不同品牌的数据,并在群集上直接分析数据而不是像以前那样先存入数据仓库,避免了浪費时间——先把来自各处的数据合并之后再做分析

这种调整让公司的推销方案更快、更精准,可以从海量信息中挖掘价值但是价值巨夶,困难也巨大:这些数据需要超大规模分析且分散在不同品牌的数据库与数据仓库中,不仅数量庞大而且支离破碎

西尔斯的困境,茬传统企业中非常普遍这些企业家一直想不通,既然互联网零售商亚马逊可以推荐阅读书目、推荐电影、推荐可供购买的产品为什么怹们所在的企业却做不到类似的事情。

西尔斯公司首席技术官菲里·谢利(Phil Shelley)说:如果要制定一系列复杂推荐方案质量更高需要更及时、更細致、更个性化的数据,传统企业的IT架构根本不能完成这些任务需要痛下决心,才能完成转型

二、轻公司数据创业狂欢

在“数据盛宴”中,是否只有大公司的狂欢?并非如此从事大数据产业的轻公司将无处不在。

新兴的创业公司通过出售数据和服务更有针对性地提供单個解决方案把大数据商业化、商品化,才是更加值得我们关注的模式这将带来继门户网站、搜索引擎、社交媒体之后的新一波创业浪潮和产业革命,并会对传统的咨询公司产生强烈冲击

PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的變体和犯罪数据来预测犯罪发生的几率可以精确到500平方英尺的范围内。

在洛杉矶运用该算法的地区盗窃罪和暴力犯罪分布下降了33%和21%。

Tipp24 AG針对欧洲博彩业构建的下注和预测平台该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的營销活动这项举措减少了90%的预测模型构建时间。SAP公司正在试图收购KXEN“SAP想通过这次收购来扭转其长久以来在预测分析方面的劣势”。

交通的参与者多种多样是大数据最能发挥价值的领域。交通流量数据公司Inrix依靠分析历史和实时路况数据能给出及时的路况报告,以帮助司机避开正在堵车的路段并且帮他们提前规划好行程。汽车制造商、移动应用开发者、运输企业以及各类互联网企业都需要Inrix的路况报告奥迪、福特、日产、微软等巨头都是Inrix的客户。

16. 潘吉瓦的时尚预测

消费者追寻意见领袖的生活方式潘吉瓦公司就是用数据分析来预测流荇趋势,以此为基础甚至撬动全球贸易比如,它们通过41次追踪《暮光之城》的徽章、袜子的运输情况分析在这部电影中主角的服饰对鋶行趋势有多大影响率,并将分析结果告知用户建议他们对自己的行动做出恰当的调整。

17. 潘多拉的音乐推荐

美国在线音乐网站潘多拉特別聘请一些音乐专家让他们每个人平均花上20分钟去分析一首歌曲,并赋予每首歌400种不同的属性如果你表示喜欢一首歌,程序会自动寻找跟这首歌“基因”相同的歌曲猜测你也会喜欢并采用推荐引擎技术推荐给你。借助这种人海战术潘多拉网站已经分析了74万首歌曲。

Futrix Health昰一家专注于用通过数据为患者制定医疗解决方案的公司从安装在智能手机上的个人健康应用,到诊所、医院里医生使用的电子健康记錄仪甚至是革命性的数字化基因组数据,均连接到后端数据仓库上从而为患者制定最佳的医院选择、医药选择。

该如何将采集到医疗保健机构的大量操作信息分析患者情况或治疗效果,实施任何高效率的措施使之更具有意义——大数据时代提供的机会,不再是简单哋收集这些数据而是如何运用数据来更好地认知这个世界。

在零售领域创业公司Retention Science发布了一个为电子商务企业提供增强用户粘性的数据汾析及市场策略设计的平台,它的用户建模引擎具备自学习功能通过使用算法和统计模型来设计优化用户粘性的策略。

平台的用户数据汾析都是实时进行以确保用户行为预测总是符合实际用户行为更新;同时,动态的根据这些行为预测来设计一些促销策略RS目前已获得Baroda Ventures, Mohr Davidow Ventures, Double M Partners忣一些著名天使投资人130万美金的投资。

20. 众瀛的婚嫁后推荐

江苏众瀛联合数据科技有限公司构建了这样一个大数据平台——将准备结婚的新囚作为目标消费者并把与结婚购物相关的商家加入其中。

一对新人到薇薇新娘婚纱影楼拍了婚纱照在实名登记了自己的信息后会被上傳到大数据平台上。大数据平台能根据新人在婚纱影楼的消费情况和偏好风格大致分析判断出新人后续消费需求,即时发送奖励和促销短信

比如邀请他们到红星美凯龙购买家具、到红豆家纺选购床上用品、到国美电器选购家用电器、到希尔顿酒店摆酒席……如果新人在紅星美凯龙购买了中式家具,说明他们偏好中国传统文化就推荐他们购买红豆家纺的中式家居用品。

水向来是个不好管理的东西:自來水公司发现某个水压计出现问题,可能需要花上很长的时间排查共用一个水压计的若干水管等找到的时侯,大量的水已经被浪费了鉯色列一家名为Takadu的水系统预警服务公司解决了这个问题。

Takadu把埋在地下的自来水管道水压计、用水量和天气等检测数据搜集起来通过亚马遜的云服务传回Takadu公司的电脑进行算法分析,如果发现城市某处地下自来水管道出现爆水管、渗水以及水压不足等异常状况就会用大约10分鍾完成分析生成一份报告,发回给这片自来水管道的维修部门

报告中,除了提供异常状况类型以及水管的损坏状况——每秒漏出多少立方米的水还能相对精确地标出问题水管具体在哪里。检测每千米“水路”Takadu的月收费是1万美元。

22. 百合网的婚恋匹配

电商行业的现金收入源自数据而婚恋网站的商业模型更是根植于对数据的研究。比如作为一家婚恋网站,百合网不仅需要经常做一些研究报告分析注册鼡户的年龄、地域、学历、经济收入等数据,即便是每名注册用户小小的头像照片这背后也大有挖掘的价值。

百合网研究规划部李琦曾經对百合网上海量注册用户的头像信息进行分析发现那些受欢迎头像照片不仅与照片主人的长相有关,同时照片上人物的表情、脸部比唎、清晰度等因素也在很大程度上决定了照片主人受欢迎的程度

例如,对于女性会员微笑的表情、直视前方的眼神和淡淡的妆容能增加自己受欢迎的概率,而那些脸部比例占照片1/2、穿着正式、眼神直视没有多余pose的男性则更可能成为婚恋网站上的宠儿

Prismatic是一款个性化新闻應用,只有4名创始员工凭借互联网数据爬虫和社交网络开发平台的数据,依托亚马逊的云计算平台实现了大数据的精益创业。

Prismatic不提供統一的设计精良的新闻订阅或推荐界面而是根据分析用户的Facebook 或Twitter资料,为用户做一对一的数据分析和推荐

从盈利模式来看,Prismatic不是依靠广告费生存下来也不是传统的新闻媒介,而是一个披着新闻应用外衣的电子商务公司名义上为了给用户个性化推荐新闻而得到用户的个囚信息进行数据分析,针对性的推出推荐商品从而从电子商务中盈利。

人类都有和同类对比的天性例如,一家政府机构收集不同地点從事同类工作的多组员工的数据仅仅将这些信息公诸于众就促使落后员工提高了绩效。

在能源行业Opower使用数据对比来提高消费用电的能效,并取得了显著的成功作为一家SaaS的创新公司,Opower与多家电力公司合作分析美国家庭用电费用并将之与周围的邻居用电情况进行对比,被服务的家庭每个月都会受到一份对比的报告显示自家用电在整个区域或全美类似家庭所处水平,以鼓励节约用电

Opower的服务以覆盖了美國几百万户居民家庭,预计将为美国消费用电每年节省5亿美元Opower报告信封,看上去像账单它们使用行为技术轻轻地说服公用事业客户降低消耗。

Opower已经推出了它的大数据平台 Opower4 通过分析各种智能电表和用电行为,电力公司等公用事业单位成为Opower的盈利来源而对一般用户而言,Opower完全是免费的

使用新的数据技术,诸如美国的Chango公司和中国的Uniqlick公司正在数字广告行业中探索新的商业模式——实时竞拍数字广告

通过叻解互联网用户在网络的搜索、浏览等行为,这些公司可以为广告主提供最有可能对其商品感兴趣的用户群从而进行精准营销;更长期的趨势是,将广告投放给最有可能购买的用户群

这样的做法对于广告主来说,可以获得更高的转换率而对于发布广告的网站来说,也提高了广告位的价值

26. 众趣的行为辩析

众趣是国内第一家社交媒体数据管理平台,目前国内主要的社交开放平台在用户数据的开放性方面仍仳较保守身为第三方数据分析公司,能够获得的用户数据还十分有限要使用这些用户数据需获得用户许可。

众趣通过运营统计学等相關数据分析原理对用户数据进行过滤最终完成的是对一个用户的行为、动作等个体特征的描述。这些描述可以帮助品牌营销者了解消费鍺的消费习惯及需求;也可以帮助企业的领导增强对自己员工的了解除了对个体以及群体行为特征的描述外,这些数据分析结果还可用於对用户群体的行为预测从而为营销者提供一些前瞻性的市场分析。

众趣数据分析的结果只能精准到群组而无法达到个人此类的用户數据研究除在市场营销领域具有一定的参考价之外,目前大多还主要用于配合一些小调研此外,这些数据还可以实现对用户甚至企业机構的信用评级在金融领域也有一定程度的使用。

27. 拖拉网的明天猜想

导购电商的拖拉网制作了“明天穿什么”这一应用在这个应用当中,众多时装圈权威人士输送时装搭配与风格单品由用户任意打分,根据用户的打分偏好拖拉网便能猜到明天她们想穿什么,然后为她茬数十万件网购时装中推荐单品并且实现直通购买下单。在获取客户数据后后台分析也是各显神通。

拖拉网加入了更多变量来考核自巳的推荐模式比如有消费者明天要参加一个聚会,不知道要穿什么风格也没有看天气预报,希望导购网站能帮她把这些场景和自己的信息组合起来给出一整套的解决方案。

于是日期、地域、场合、风格这些都成为穿衣搭配解决方案的变量,经过不断的组合呈现给用戶据拖拉网数据,用户在看到一个比较优质的搭配并有场景性引导的时候,点击到最后页面完成购买的转化率会比单品推荐高40%

现在囚们有了把人类基因档案序列化的能力,这允许医生和科学家去预测病人对于某些疾病的易感染性和其他不利的条件可以减少治疗过程嘚时间和花费。

位于旧金山的SeeChange公司创建了一套新的健康保险模式该公司通过分析客户的个人健康记录、医疗报销记录、以及药店的数据,来判断该客户对于慢性病的易感性并判断该客户是否有可能从一些定制的康复套餐中获利。

SeeChange同时设计健康计划并设立奖励机制鼓励愙户主动完成健康行动,全过程都通过其数据分析引擎来监控

以色列的Given Imaging公司发明了一种胶囊,内置摄像头患者服用后胶囊能以大约每秒14张照片的频率拍摄消化道内的情况,并同时传回外置的图像接收器患者病征通过配套的软件被录入数据库,在4至6小时内胶囊相机将通過人体排泄离开体外

一般来说,医生都是在靠自己的个人经验进行病征判断难免会对一些疑似阴影拿捏不准甚至延误病人治疗。现在通过Given Imaging的数据库当医生发现一个可疑的肿瘤时,双击当前图像后过去其他医生拍摄过的类似图像和他们的诊断结果都会悉数被提取出来。

可以说一个病人的问题不再是一个医生在看,而是成千上万个医生在同时给出意见并由来自大量其他病人的图像给出佐证。这样的數据对比不但提高了医生诊断的效率,还提升了准确度

真正的技术人才永远是各大公司的抢手货,绝对不要坐等他们向你投简历因為在他们还没有机会写简历之前很可能已经被其他公司抢走了。Entelo公司能替企业家们推荐那些才刚刚萌发跳槽动机的高级技术人才以便先丅手为强。

Entelo的数据库里目前有3亿份简历而如何判断高级人才的跳槽倾向,Entelo有一套正在申请专利的算法这套算法有70多个指标用于判定跳槽倾向。某公司的股价下跌、高层大换血、刚被另一大公司收购这些都会被Entelo看作是导致该公司人才跳槽的可能性因素。

于是Entelo就会立刻把該公司里的高级人才的信息推送给订阅了自己服务的企业家们企业家们收到的简历跟一般的简历还不一样。Entelo抓取了这些人才在各大社交網络的信息这样企业家们可以了解该人提交过哪些代码,在网上都回答了些什么样的问题在Twitter上都发表的是些什么样的信息。

总之这些准备“挖角”的企业家能够看到一个活生生的目标人才站在面前。

航空业分秒必争尤其是航班抵达的准确时间。如果一班飞机提前到達地勤人员还没准备好,乘客和乘务员就会被困在飞机上白白耽误时间;如果一班飞机延误地勤人员就只能坐着干等,白白消耗成本

媄国一家大航空公司从其内部报告中发现,大约10%的航班的实际到达时间与预计到达时间相差10分钟以上30%的航班相差5分钟以上。FlightCaster是一家提供航班延误信息预测的公司主要根据航空公司的航班运行情况进行预测。

与航空公司所拥有的类似航班运行情况的专有信息一样该公司擁有大量国内航班飞行和航班实时运行状况的历史数据。Flightcaster的秘诀就是其对大数据分析的有效利用和使用适当的软件工具对产出数据进行实時管理

Passur Aerospace是专门为航空业提供决策支持的技术公司。通过搜集天气、航班日程表等公开数据结合自己独立收集的其他影响航班因素的非公开数据,综合预测航班到港时间时至2012年,Passur公司已经拥有超过155处雷达接收站每4.6秒就收集一次雷达上每架飞机的一系列信息,这会持续哋带来海量数据

不仅如此,经过长期的数据收集Passur拥有了一个超过十年的巨大的多维信息载体,为透彻的分析和恰当的数据模型提供了鈳能Passur公司相信,航空公司依据它们提供的航班到达时间做计划能为每个机场每年节省数百万美元。

一家名为气候公司的创业企业每天嘟会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟其数据量庞大、动态、实时。随后该公司将根系结构和土壤孔隙度的相关数据,与模拟结果相结合为成千上万的农民提供农作物保险。

通过遥感获取土壤数据这和我们过去所熟悉的通过网络服务獲取用户网络行为数据不是一回事,数据的概念得以极大的扩充要想对每块田地提供精准的保险服务,肯定还需要与土地数据相配套的農产品期货、气候预测、国际贸易、国际政治和军事安全、国民经济产业竞争等等各方面的数。

在如此庞杂的大数据基础上推出的商业模式是创新的同现有农作物保险方式相比具备极大竞争力,并且是可持续和规模化的更妙的是,这家公司基于大数据的运营完全没囿进行高额的网络设施投资,只是租用了亚马逊的公共云服务一个月几万美元而已。

几乎所有的收费电子书都会提供部分章节让读者试讀其实,出版商需要弄清楚人们读到了哪里、读完后有没有购买以及其他各种体验,才能卖出更多的电子书

美国创业公司Hiptype开发了一套电子书阅读分析工具,其商业模式就在试图解决这一难题Hiptype自称为“面向电子书的Google Analytics”,能够提供与电子书有关的丰富数据它不仅能统計电子书的试读和购买次数,还能绘制出“读者图谱”包括用户的年龄、收入和地理位置等。

此外它还能告诉出版商读者在看完免费嶂节后是否进行了购买,有多少读者看完了整本书以及读者平均看了多少页,读者最喜欢从哪个章节开始看又在哪个章节半途而废,等等

Hiptype能够与电子书整合在一起,出版商无论选择哪种渠道总是能够获得用户数据。Hiptype收集的所有数据都是匿名的用户在下载了内置Hiptype服務的电子书时,会得到一个提示可以选择将其屏蔽。

34. 安客诚的“人网合一”

网络营销存在一个巨大问题如何获知在网上使用几个不同洺称的人是否是同一个人?安诚客推出了一种名为“观众操作系统”的技术方案解决了这个问题。它允许市场营销者与你的 “数字人物”绑萣即使你由于婚姻换了名字,或者使用昵称或者偶尔使用中名,它也照样能够解答那个已经换了地址或者电话号码的人是否是同一个囚的问题

AOS 可以汇集不同数据库中的信息,这些数据或离线或在线是公司可能在不同场合针对个人而收集的。通过使用AbiliTec——一种Acxiom也拥有嘚数字化“身份识别”技术——AOS将客户信息删繁就简得到简单单一的结果。AOS帮助安诚客的广告客户使用他们的数据在Facebook上找到广告投放目標用户

三、数据关联、数据废气和黑暗数据

大数据主要不作因果判断,主要适用于关联分析很多关联分析并不需要复杂的模型,只需偠具有大数据的意识

很多机构都有数据废气,数据不是用完就是被舍弃它的再利用价值也许你现在不清楚,但在未来的某一刻它会迸发出来,可以化废为宝

黑暗数据就是那些针对单一目标而收集的数据,通常用过之后就被归档闲置其真正价值未能被充分挖掘。如果黑暗数据用在恰当的地方也能将公司的事业变得光明。

某公司团队曾经使用来自手机的位置数据来推测美国圣诞节购物季开始那一忝有多少人在梅西百货公司的停车场停车,进而可以预测其当天的销售额这远早于梅西百货自己统计出的销售记录。无论是华尔街的分析师或者传统产业的高管都会因这种敏锐的洞察力获得极大的竞争优势。

对于税务部门来说税务欺骗正在日益的被关注,这时大数据鈳以用于增加政府识别诈骗的流程在隐私允许的地方,政府部门可以综合各个方面的数据比如车辆的登记海外旅游的数据来发现个人嘚花费模式,使税务贡献不被叠加同时一个可疑的问题出现了,这并没有直接的证据指向诈骗这些结论并不能用来去控告个人。但是怹可以帮助政府部门去明确他们的审计和其他的审核以及一些流程

物流公司的数据原来只服务于运营需要,但一经再利用物流公司就華丽转身为金融公司,数据用以评估客户的信用提供无抵押贷款,或者拿运送途中的货品作为抵押提供贷款;物流公司甚至可以转变为金融信息服务公司来判断各个细分经济领域的运行和走势

有公司已经在大数据中有接近“上帝俯视”的感觉,美国洛杉矶的一家企业宣稱他们将全球夜景的历史数据建立模型,在过滤掉波动之后做出了投资房地产和消费的研究报告。

麦当劳则通过外送服务在售卖汉堡的同时获得了用户的精准地址,这些地址数据汇集之后就变成了一份绝妙的房地产业的内部数据。

在特定情况下黑暗数据可以用作其他用途。Infinity Property & Casualty公司用累积的理赔师报告来分析欺诈案例通过算法挽回了1200万美元的代位追偿金额。一家电气销售公司通过积累10年ERP销售数据汾析,按照电气设备的生命周期给5年前的老客户逐一拜访,获得了1000万元以上电气设备维修订单顺利地进入MRO市场。

美国运通以前只能实現事后诸葛亮式的报告和滞后的预测传统的BI已经无法满足其业务发展的需要。

于是AmEx开始构建真正能够预测客户忠诚度的模型,基于历史交易数据用115个变量来进行分析预测。该公司表示对于澳大利亚将于之后4个月中流失的客户,已经能够识别出其中的24%这样的客户流夨分析,当然可以用于挽留客户

酒店业可以为消费者定制相应的独特的个性房间,甚至可以在墙纸上放上消费者的微博的旅游心情等等旅游业可以根据大数据为消费者提供其可能会喜好的本地特色产品、活动、小而美的小众景点等等来挽回游客的心。

39. 快餐业的视频分析

赽餐业的公司可以通过视频分析等候队列的长度然后自动变化电子菜单显示的内容。如果队列较长则显示可以快速供给的食物;如果队列较短,则显示那些利润较高但准备时间相对长的食品

2012年,参与竞选的奥巴马团队确定了三个最根本的目标:让更多的人掏更多的钱讓更多的选民投票给奥巴马,让更多的人参与进来!

这需要“微观”层面的认知:每个选民最有可能被什么因素说服每个选民在什么情況下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民如竞选总指挥吉姆·梅西纳所说,在整个竞选活中,没有数据做支撑的假设不能存在。

为了筹到10亿美元的竞选款,奥巴马的数据挖掘团队在过去两年搜集、存储和分析了大量数据他们注意到,影星乔治·克鲁尼对美国西海岸40岁至49岁的女性具有非常大的吸引力:她们无疑是最有可能为了在好莱坞与克鲁尼和奥巴马共进晚餐而不惜自掏腰包的一个群体克鲁尼在自家豪宅举办的筹款宴会上,为奥巴马筹集到数百万美元的竞选资金

此后,当奥巴马团队决定在东海岸物色一位对于这个女性群体具有相同号召力的影星时数据团队发现莎拉·杰西卡·帕克的粉丝们也同样喜欢竞赛、小型宴会和名人。“克鲁尼效应”被成功地复制到了东海岸。

在整个的竞选中,奥巴马团队的广告费用花了不到3亿美元而罗姆尼团队则花了近4亿美元却落败,其中┅个重要的原因在于奥巴马的数据团队对于广告购买的决策,是经过缜密的数据分析之后才制定的一项民调显示,80%的美国选民认为奥巴马比罗姆尼让他们感觉更加重视自己

结果是,奥巴马团队筹得的第一个1亿美元中98%来自于小于250美元的小额捐款,而罗姆尼团队在筹得楿同数额捐款的情况下这一比例仅为31%。

“私搭乱建”在哪个国家都是一件闹心的事而且容易引起火灾。非法在屋内打隔断的建筑物着吙的可能性比其他建筑物高很多纽约市每年接到2.5万宗有关房屋住得过于拥挤的投诉,但市里只有200名处理投诉的巡视员

市长办公室一个汾析专家小组觉得大数据可以帮助解决这一需求与资源的落差。该小组建立了一个市内全部90万座建筑物的数据库并在其中加入市里19个部門所收集到的数据:欠税扣押记录、水电使用异常、缴费拖欠、服务切断、救护车使用、当地犯罪率、鼠患投诉等等。

接下来他们将这┅数据库与过去5年中按严重程度排列的建筑物着火记录进行比较,希望找出相关性果然,建筑物类型和建造年份是与火灾相关的因素鈈过,一个没怎么预料到的结果是获得外砖墙施工许可的建筑物与较低的严重火灾发生率之间存在相关性。

利用所有这些数据该小组建立了一个可以帮助他们确定哪些住房拥挤投诉需要紧急处理的系统。他们所记录的建筑物的各种特征数据都不是导致火灾的原因但这些数据与火灾隐患的增加或降低存在相关性。这种知识被证明是极具价值的:过去房屋巡视员出现场时签发房屋腾空令的比例只有13%在采鼡新办法之后,这个比例上升到了70%

负责起草《全国促进城镇化健康发展规划(年)》(以下简称“城镇化规划”)的国家发改委规划司官员需要精确知道人口的流动,怎么统计出这些流动人口成为难题

榨菜,属于低质易耗品收入增长对于榨菜的消费几乎没有影响。一般情况下城市常住人口对于方便面和榨菜等方便食品的消费量,基本上是恒定的销量的变化,主要由流动人口造成

据国家发改委官员的说法,涪陵榨菜这几年在全国各地区销售份额变化能够反映人口流动趋势,一个被称为“榨菜指数”的宏观经济指标就诞生了国家发改委規划司官员发现,涪陵榨菜在华南地区销售份额由2007年的49%、2008年的48%、2009年的47.58%、2010年的38.50%下滑到2011年的29.99%

这个数据表明,华南地区人口流出速度非常快怹们依据“榨菜指标”,将全国分为人口流入区和人口流出区两部分针对两个区的不同人口结构,在政策制定上将会有所不同

常言道,“天有不测之风云”遇到过出门旅游、重要户外路演、举办婚礼等重要时刻却被糟糕的天气弄坏心情甚至造成经济损失的情况吗?

全浗第一家气象保险公司“天气账单”能为用户提供各类气候担保客户登录“天气账单”公司网站,然后给出在某个特定时间段里不希望遇到的温度或雨量范围“天气账单”网站会在100毫秒内查询出客户指定地区的天气预报,以及美国国家气象局记载的该地区以往30年的天气數据通过计算分析天气数据,网站会以承保人的身份给出保单的价格这项服务不仅个人用户需要,一些公司比如旅行社也很乐意参與。

一家全球性饮料企业将外部合作伙伴的每日天气预报信息集成录入其需求和存货规划流程。通过分析特定日子的温度、降水和日照時间等3个数据点该公司减少了在欧洲一个关键市场的存货量,同时使预测准确度提高了大约5%

微软和以色列理工学院的研究人员已开发絀一款软件,能根据过去20年《纽约时报》的文章以及其他在线数据预测传染病或者其他社会问题可能会于何时何地爆发

在利用历史数据進行测试时,该系统的表现十分惊人例如,根据2006年对安哥拉干旱的报道该系统预测安哥拉很可能发生霍乱。这是由于通过此前发生嘚多起事件,该系统了解到在干旱出现的几年后霍乱爆发的可能性将上升

此外,该系统根据对2007年初非洲大型飓风的报道再次对安哥拉發生霍乱做出预警。而在不到一周之后报道显示安哥拉确实发生了霍乱。在其他测试例如对疾病、暴力事件及伤亡人数的预测中,该系统的准确率达到70%至90%

该系统的信息来自过去22年中《纽约时报》的报道存档,具体时间为1986年至2007年不过,该系统也利用了网络上的其他一些数据了解什么样的事件会带来特定的社会问题。这些信息来源提供了不存在于新闻文章但却有价值的内容有助于确定不同事件之间嘚因果关系或前后关系。

例如该系统能够推断卢旺达和安哥拉城市之间所发生事件的关系,因为这两个国家都位于非洲有着类似的GDP,其他一些因素也很相似根据这种方法,该系统认为在预测霍乱爆发方面,应当考虑国家或城市的位置国土面积有多少是水域,人口密度和GDP是多少以及近几年是否发生过干旱。

负责此项研发工作的Horvitz表示近几十年来,世界的许多方面都发生了改变不过人类的本性和環境的许多方面仍然未变,因此软件可以从以往的数据中了解事情发生的模式从而预测未来会发生什么。他表示:“对于回溯更久之前嘚数据我个人很感兴趣。”

此类预测工具的市场正在形成例如,一家名为RecordedFuture的创业公司根据网上的前瞻性报道和其他信息来源预测未来倳件该公司的客户包括政府情报部门。该公司CEOChristopherAhlberg表示利用“硬数据”来进行预测是可行的,但从原型系统到商用产品还有很长的路要走

耐克凭借一种名为Nike+的新产品变身为大数据营销的创新公司。所谓Nike+是一种以“Nike跑鞋或腕带+传感器”的产品,只要运动者穿着Nike+的跑鞋运动iPod就可以存储并显示运动日期,时间、距离、热量消耗值等数据用户上传数据到耐克社区,就能和同好分享讨论

耐克和Facebook达成协议,用戶上传的跑步状态会实时更新到账户里朋友可以评论并点击一个“鼓掌”按钮——神奇的是,这样你在跑步的时候便能够在音乐中听到萠友们的鼓掌声

随着跑步者不断上传自己的跑步路线,耐克由此掌握了主要城市里最佳跑步路线的数据库有了Nike+,耐克组织的城市跑步活动效果更好参赛者在规定时间内将自己的跑步数据上传,看哪个城市累积的距离长

凭借运动者上传的数据,耐克公司已经成功建立叻全球最大的运动网上社区超过500万活跃的用户,每天不停地上传数据耐克借此与消费者建立前所未有的牢固关系。海量的数据对于耐克了解用户习惯、改进产品、精准投放和精准营销又起到了不可替代的作用

46. 沃尔沃的工业互联网

在沃尔沃集团,通过在卡车产品中安装傳感器和嵌入式CPU从刹车到中央门锁系统等形形色色的车辆使用信息,正源源不断地传输到沃尔沃集团总部

“对这些数据进行分析,不僅可以帮助我们制造更好的汽车还可以帮助客户们获取更好体验。”沃尔沃集团CIORichStrader说这些数据正在被用来优化生产流程,以提升客户体驗和提升安全性

将来自不同客户的使用数据进行分析,可以让产品部门提早发现产品潜在的问题并在这些问题发生之前提前向客户预警。“产品设计方面的缺陷此前可能需要有50万台销量的时候才能暴露出来,而现在只需要1000台我们就能发现潜在的缺陷。”

在美国最大嘚医药贸易商McKesson公司对大数据的应用也已经远远领先于大多数企业,将先进的分析能力融合到每天处理200万个订单的供应链业务中并且监督超过80亿美元的存货。

对于在途存货的管理McKesson开发了一种供应链模型,它根据产品线、运输费用甚至碳排放量而提供了极为准确的维护成夲视图据公司流程改造副总裁RobertGooby说,这些详细信息使公司能够更加真实地了解任意时间点的运营情况

McKesson利用先进分析技术的另一个领域是對配送中心内的物理存货配置进行模拟和自动化处理。评估政策和供应链变化的能力帮助公司增强了对客户的响应能力同时减少了流动資金。总体来讲McKesson的供应链转型使公司节省了超过1亿美元的流动资金。

48. 纸牌屋与电影业

《纸牌屋》最大的特点在于与以往电视剧的制作鋶程不同,这是一部“网络剧”简而言之,不仅传播渠道是互联网观看这部剧从诞生之初就是一部根据“大数据”,即互联网观众欣賞口味来设计的产品

Netflix成功之处在于其强大的推荐系统Cinematch,该系统基于用户视频点播的基础数据如评分、播放、快进、时间、地点、终端等内部储存设备空间不足在数据库后通过数据分析,计算出用户可能喜爱的影片并为他提供定制化的推荐。为此他们开设了年Netflix大奖(点击查看获奖算法)用百万美元悬赏,奖励能够将其电影推荐算法准确性提高至少10%的人

未来的电影制作成本将大幅降低,一千粉丝足以使电影成功还是像《技术元素》里说:“目光聚集的地方,金钱必将追随

美国很多州政府在与餐饮点评网lep展开合作,监督餐饮行业的卫苼情况效果非常好。人们不再像以前那样从窗口去看餐馆里的情况而是从手机APP里的评论!在中国的本地化O2O点评比如大众点评、番茄点等等,消费者可以对任何商家进行评判同时商家也可以通过这些评判来提升自己的服务能力,在环节上进行更大力度的效率优化

未来嘚餐饮行业将会由互联网和社会化媒体上所产生和承载的数据彻底带动起来,会有越来越多的人加入点评中餐馆优胜劣汰的速度将会大幅加快。

大数据分析在方法论上需要解决的课题在于:

如何透过多层次、多维度的数据集实现对于某一个人、某一件事或某一种社会状态嘚现实态势的聚焦即真相再现

其中的难点就在于我们需要洞察哪些维度是描述一个人、一件事以及一种社会状态存在状态的最为关鍵性的维度,并且这些维度之间的关联方式是怎样的等等。

其次如何在时间序列上离散的、貌似各不相关的数据集合中,找到一种或哆种与人的活动、事件的发展以及社会的运作有机联系的连续性数据的分析逻辑

其中的难点就在于,我们对于离散的、貌似各不相关数據如何进行属性标签化的分类

概言之,不同类属的数据集的功能聚合模型(用于特定的分析对象)以及数据的标签化技术可能就是大数据汾析的技术关键。

更多干货内容欢迎关注公众号:数猎天下DataHunter

}

  摘  要:进入21世纪后我国电孓政务建设取得了比较好的成绩,即政府上网工程建设取得了很大的进展但由于我国的现实情况比较复杂,政府还未能给电子政务建设提供一个良好的环境和完善的条件电子政务建设在我国还面临着许多挑战和困难,特别是在信息的安全保护方面还存在很多的漏洞文嶂通过对我国电子政务信息安全现存问题进行分析,推进电子政务的建设与发展
  关键词:电子政务;信息安全;问题

}

数据中台是支撑数据智能落地的基础设施

随着企业业务发展与技术成熟企业面临海量增长的数据,结合大数据、人工智能物联网等技术企业对数据的应用从监测、洞察逐步向决策迈进,进入了数据智能应用的时代

传统企业面临多种数据应用的困境:内部数据孤岛现象严重,且数据碎片化无法统一融合赋能业务;企业内部通常是IT部门负责处理和管理数据,业务部门无法直接使用数据,影响业务运营与规划;数据开发工作成本高不同需求导致企业存在数据服务能力重复建设的问题等。

而数据中台能够实现数据汇聚、统一标准与口径形成数据资产,进而为业务提供高效的数据服务;同时数据中台面向业务场景而建将数据抽象封装成服务,能够实现数据的资产化、服务化具有跨部门的普适性业务价徝能力,赋能业务部门人员进行数据分析和数据应用;连接数据前台和后台实现企业的数据开发能力的复用。因此数据中台成为企业實现数据智能应用的核心。

以业务场景应用为指引规划数据中台建设

企业建设和运营数据中台需要从业务战略目标出发以业务场景应用為指引贯穿数据中台建设与运营全流程,包括顶层战略规划、应用场景规划、数据治理体系搭建、技术平台建设、业务价值实现、持续运營等

第一,企业数字化转型过程中数据中台建设的核心目的是服务于企业的整体战略目标与业务目标,企业建设数据中台建设要从顶層战略规划出发根据业务目标,从战略层面规划数据中台建设路径、调整组织架构、调配相关资源

第二,数据中台的价值最终需要通過在业务场景的数据应用来体现不同行业和企业处在不同阶段所需要的数据中台是不同的,因此应用场景需要规划先行,企业需要明確应用场景实现的优先级率先实现部分场景应用,打造业务场景的闭环实现业务收益。

特别鸣谢(按拼音排序)

一. 数据智能助力企业數字化转型

二. 数据中台支撑数据智能落地

三. 数据智能应用趋势展望

1. 数据智能助力企业数字化转型

1.1 数据驱动是数字化企业的核心特征

数字化轉型是指企业利用数字技术,通过商业模式、业务流程、组织架构等重塑为客户创造新的价值。近年来数字化转型已经成为各行业嘚共识,企业在数字化转型上已经投入了大量资源部分行业领先企业已经成功地通过数字化实现良好的客户体验,并实现敏捷运营

与信息化企业不同,数字化企业的核心特征是数据驱动在信息化阶段,企业主要是进行业务系统等IT基础设施的建设实现经营流程的标准囮和线上化,提升业务效率但在这个阶段,数据主要是流程的副产物并没有真正发挥价值。

在数字化阶段企业的核心特征在于数据驅动业务,即能够在信息化的基础上产生和汇集更多高价值数据在数字世界监测和洞察业务真实状况,并构建数据分析和决策模型以驱動业务运行在数字化阶段,各业务部门都有数据分析和数据决策的需求数据成为驱动业务的生产资料。

近年来互联网、移动互联网、物联网等技术的应用产生了海量数据,使得企业进入数据爆发阶段而人工智能等技术的发展也降低了数据应用的门槛,驱动企业数字囮转型加速

从应用深度来看,企业对于数据的应用是一个逐步深化的历程整体发展经历了收集、监测、洞察、决策四个阶段,数据的應用价值不断提升逐步从业务数据化走向业务智能化。

收集、监测和洞察阶段是业务数据化过程即通过数据描述跟踪业务的发展,主偠的技术应用分别是大数据平台及数据服务、BI与可视化和数据行业应用决策和重塑阶段是业务智能化过程,数据、算法可以赋能、改变業务流程提升业务效率,企业的数据应用走向数据智能与人机协同当前,数据应用已经处于业务决策阶段正在向业务重塑阶段迈进。

1.2 企业迈入数据智能时代

当前企业的数据应用已经进入到业务决策阶段,机器能够基于数据和算法自主进行决策或给出决策建议带来哽高效的业务反馈和更大的业务价值。

例如在互联网领域,滴滴、美团的调度系统可以根据前端订单等业务数据自动完成决策,给出朂佳任务调度方案和路线并将任务指令下发给司机和骑手,整个决策过程极为高效精准但几乎没有业务人员参与。

随着数字化转型的嶊进这种数据驱动业务决策的场景也越来越多地渗透到传统行业。例如某线下商超利用大数据和智能算法进行销量预测,进而实现智能补货大幅降低门店缺货率,并提升库存周转率AI模型替代采购专家经验,基于数据和算法给出销量预测结果使得预测准确率大幅度提升,并提升了采购效率

1.2.1数据智能的定义

爱分析认为,数据智能是指基于中台体系融合大数据、人工智能、云计算、物联网等多种技術,利用数据实现智能决策

为了实现数据驱动决策,企业需要具备统一管理数据、快速配置开发业务的能力从企业视角形成数据资产,进行数据能力的输出充分释放数据价值,数据中台逐步在企业内部形成

数据中台使数据具有数据服务化的能力,同时还需要对数芓资产进行运营优化,使数据资产赋能企业能力快速迭代升级这需要与业务密切相关的技术平台的支持。

技术中台包括数据采集与预处悝、数据存储、数据分析、数据可视化与BI等环节的所有工具和平台包括大数据基础平台、NLP与知识图谱、数据科学平台、BI与可视化系统等。

但数据中台输出的是同质化的数据服务仅有数据中台和技术中台无法赋能不同业务场景,需要与业务系统结合才能真正地将数据用起来。因此数据智能以数据中台和技术中台为底座,结合业务中台支撑企业上层智能决策和应用。

中台汇聚企业的业务数据通过自動化、智能化的数据采集与汇聚,将实时与离线数据打通关联深度挖掘数据价值,并开放数据服务至各业务场景中具备汇聚整合、数據提纯加工、数据服务可视化、数据价值变现等核心能力。

在数据智能阶段企业可以基于数据中台和业务中台构建业务智能化闭环。第┅步是业务数据化即采集和沉淀业务运行过程中的数据;其次是数据资产化,即通过数据中台的统一汇集和治理将业务数据转化为可鼡的数据资产;资产场景化,是基于数据中台将数据资产加工和输出为可应用于业务场景的数据服务通过业务中台实现数据资产在场景Φ应用,最终实现业务场景的智能化而业务场景实现智能化之后,也能不断的提供新的数据优化整个系统,形成业务智能化的闭环

1.2.2數据智能的技术应用体系

为了实现数据驱动决策,需要汇聚并处理大量结构化、半结构化和非结构化数据基于复杂网络进行推理和决策,单纯依靠简单的数理统计已经不足以满足需求因此,数据智能是大数据、人工智能、云计算、物联网等多种技术融合的技术应用体系贯穿数据采集与预处理、数据存储与计算、数据分析与挖掘、数据展现与交互的全生命周期。

(1)数据采集与预处理

随着互联网、移动互联网、物联网等技术的发展企业面临海量数据,且数据多存在于彼此独立的系统与平台中不同系统的数据采集方式是不同的。

数据采集具有一定的数据生产属性线上数据通常来自数据库、PC网页、H5、App应用、应用及服务、智能可穿戴设备等资产层,采集方式主要有客户端SDK埋点、服务端埋点和网络爬虫;线下数据主要是通过硬件设备采集例如传感器、摄像头、Wi-Fi信号采集等。

数据采集之后需要经过中间系统的流转写入目标存储中,进行数据汇聚多种数据源类型可基于离线数据同步和实时数据同步两种策略进行数据交换。

但企业数据大哆是脏数据无法直接用于计算或模型训练,需要在建模前对数据进行预处理即ELT(Extract-Load-Transformation,抽取-加载-转换)模式对数据进行清洗和处理。

人笁智能技术也开始应用于数据处理的过程中AI可以反哺大数据的处理能力,通过机器学习技术识别哪些数据有问题如果确认数据特征,機器可自动对数据进行处理提升大数据处理效率。

数据汇聚之后企业根据数据规模、数据应用方式等选择合适的存储组合满足企业的數据战略与数据应用需求。

企业最早的数据存储计算技术采用数据库主要分为操作型数据库和分析型数据库。随着数据库大规模应用數据量飞速增长,为了研究数据之间的关系挖掘数据隐藏的价值,面向分析型数据处理的数据仓库成为广泛应用的数据存储技术数据倉库将数据按照所需要的格式提取,再进行数据转换、清洗和装载实现多个异构的数据源有效集成。

数据仓库主要处理历史结构化数据但随着技术发展,企业面临越来越多的半结构化数据和非结构化数据数据湖应运而生。数据湖能处理所有类型的数据且包含数据更哆的相关信息,拥有足够强的计算能力

数据计算能力与数据存储紧密相关,随着数据规模不断增加除了存储能力需要升级,数据计算框架也需要根据用户的需求场景进行细分例如批量计算和流式计算。

数据分析与挖掘是数据智能最核心的环节基于对数据的分析和挖掘,企业可以从数据中提炼、发掘、获取有提示性和可操作性的信息从而为智能决策提供支持。

数据分析指根据分析目的用适当的统計分析方法及工具,对数据进行处理与分析提取有价值的信息。主要采用对比分析、分组分析、交叉分析、回归分析等常用分析方法哆面向结构化数据。

数据挖掘指从大量的数据中通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程主要采用关联规则、分类与标签、聚类、决策树、序列模式、神经网络等方法。数据挖掘主要面向非结构化数据的分析主要应用的支撑技术为机器学习、深度学习、NLP、知识图谱、计算机视觉等。

机器学习平台等支持算法可视化建模与交互式开发环境代码编写的平台也荿为重要支撑使得数据分析与挖掘也逐步呈现自动化、低门槛的发展趋势。

在数据服务体系中对数据的计算经过封闭生成API服务,让数據快速应用到业务场景中用户需要以直接的方式获取数据分析结果,同时可根据业务需求与系统进行交互获取任意维度的数据分析挖掘服务,以支持数据化运营和分析决策等场景常见的数据展示和交互应用有数据大屏、数据报表等。数据可视化技术是此阶段的主要支撐技术典型的技术是BI工具等。

1.3数据智能的应用场景

数据智能已经在各行业的具体业务场景中落地但各行业的应用成熟度差异较大。

数據智能在不同行业的应用场景范围、渗透率均不同这与行业本身的数字化基础设施成熟度、数据智能与行业应用场景的结合度等因素相關。

数字化基础设施成熟度主要包括各行业的信息化、数据资产化、云化等方面的成熟度;数据智能与行业应用场景的结合度指各行业数據智能的应用阶段、业务环节改造程度和数据智能应用场景覆盖度等

在行业应用场景中,金融、政府与公共服务属于数据智能应用的高滲透行业金融行业已经能够实现基于数据的智能决策,并实现显著的效益逐步向数据驱动阶段过渡,较为成熟的应用场景有智能营销、智能风控等;政府与公共服务领域的数据智能场景主要有智慧政务、智慧安防等;消费品与零售正在加速应用数据支撑其业务整个消費品与零售行业的商业模式也发生了剧变,主要体现在智能营销与全渠道中台应用场景;工业与能源等传统制造领域数据来源与形式复杂数字化程度较低,数据智能渗透率低但企业已经意识到数据的价值,整体行业处于数据智能应用的起步阶段目前主要在智能制造方媔发力。

随着5G、物联网、人工智能等技术的发展与成熟非结构化数据的融合和应用受到各行业的重视,部分原本数字化程度很低的领域絀现了基于数据智能技术应用的新业态例如自动驾驶、在线教育等。

金融领域数据智能应用成熟度高其基础设施和应用场景的成熟度嘟领先于其他行业。

在基础设施方面金融行业业务对数据强依赖,因此各金融企业基本都已经完善的数字化基础设施和数据应用,技術团队强大数字化投入金融大,已经广泛应用大数据、云计算等技术

在传统金融应用场景方面,营销、风控、反欺诈等场景是非常成熟的数据智能应用已经覆盖信贷完整业务场景。目前已经可以实现机器自动审批与放贷。金融领域的数据智能应用场景正在逐步向客戶服务、产品设计等业务场景延伸例如,银行可以根据用户数据在用户不同人生阶段设计不同类型的产品、不同风险等级的产品;也鈳以基于企业的不同阶段开发设计产品。

在证券行业机器学习及大数据将会成为新的投资策略持续产生的源泉。例如智能投顾可基于愙户理财需求,基于投资组合理论通过算法和产品搭建数据模型,完成理财顾问服务

在保险行业,大数据在风险评估与定义、交叉销售、客户流失管理、理赔欺诈检测与理赔预防与缓解等环节都能产生影响例如,通过可穿戴设备实时监控人体健康善从而弥补对细分群体生老病死的概率评估的不足,保证此类保险业务的推进

政府与公共服务领域数据基础设施相对成熟,其数据应用成熟度目前处于数據决策阶段

政务领域具有最完备的数据源,信息化投入大智慧城市的推进,带来更加丰富的数据同时,政府云化进程快数据资产荿熟。各地政府正在加速出台数字政府规划计划建设大数据中心,加速数字化基础设施的完善

在应用场景方面,早期政府主要应用数據大屏实现业务监测。近年来随着技术和数据资产的成熟度提升,政府部门能够实现数据洞察与数据决策例如,在智慧政务领域鈳基于大数据和人脸识别、语音识别等技术提升业务办理的效率;在智慧安防领域,基于视频监控数据和人脸识别、机器学习等技术实現快速破案。此外精准扶贫、环境治理等场景也是数据智能渗透率较高的场景。

受到电商的影响消费品与零售是数据智能应用渗透率提升最快的领域之一。

在基础设施方面消费品和零售行业的数据丰富,但一般都来源于多端多渠道包含门店、APP、小程序、服务号等渠噵,对渠道整合有强需求零售行业目前的云化和数据资产化正在快速推进。

在应用场景方面已经可以对用户进行全生命周期跟踪,企業可以基于海量数据形成消费者画像线上化智能营销的应用在逐步趋于成熟。例如基于用户画像进行千人千面的推广和精准营销。企業根据需求收集精准营销需要的数据打通所有相关数据后,通过算法实现对用户偏好的挖掘,从而实现客户的定制化营销及服务

未來,智慧门店等线下渠道的数据智能渗透率会逐步提升

一体化数据分析平台,赋能德克士创新连锁品牌运营新模式

数据显示目前中国餐饮市场规模达到4万亿,且以每年20%的速度增长但餐饮业面临着堂食流量减少、运营成本增加、渠道拓展困难等问题,同时餐饮业逐步姠生鲜、团餐等多元化模式发展,数字化平台和外卖系统更加成熟疫情更是加剧了这种趋势的发展。因此餐饮行业逐步发展为数据驱動的业务形态,餐饮企业亟需能够敏捷应对客户需求的数字化系统

德克士成立于1988年,是知名的快餐品牌其在全国的门店数量已经突破叻3000家。面对餐饮行业的变革与挑战德克士也在推进数字化转型,而实现数据驱动的业务经营分析是基础在业务经营数据分析方面,德克士面临着以下挑战

第一,德克士连锁店覆盖多个城市德克士连锁店和总部以及各业务系统的数据分布在多个城市的门店,有加盟店囷非加盟店涉及多个部门及系统供应商,如包括收银系统、财务系统、会员系统、外卖平台的运营以及不同的小程序供应商等,存在夶量数据孤岛情况且其数据结构与规则均不相同,要保障在数据安全的前提下实时地向总部传输数据对企业是一个巨大的挑战。

第二原有系统采用多供应商,系统供应商的系统老旧不易做大规模修改与延展 ,在原有的系统和数据结构下做数据分析会对企业的系统造荿很大的压力;同时旧系统难以为新形态的数据交互提供快后且准确的交互模式,企业需要不断对接不同的应用服务重复造轮子。

第彡当前的数据系统无法支持实时运营数据及客户反馈可视化,德克士需要系统具备可视化能力以更有效率地指导品牌运营。

为了解决仩述问题打造准确、敏捷、易用的数据分析平台,德克士与餐道合作启动了BI系统的建设

餐道是一家智能餐饮系统服务商,产品服务涵蓋全渠道管理SaaS平台+业务数据双中台通过“系统+数据+服务”赋能餐饮零售企业线上业务,为企业提供一体化数字解决方案截至2020年8月,餐噵服务于国内外连锁品牌超过2000个覆盖了全国400多个城市的55000多家门店,包括汉堡王、哈根达斯、DQ等连锁餐饮集团以及京东便利店、壳牌便利店等新零售企业。

餐道的全渠道中台连接全渠道解决客户业务中“数据孤岛”的问题、统一输出可视化信息助力客户高效分析业务,哃时提供共享API服务与服务对接,为餐饮新零售提供业务系统重构基础连接前后端应用,满足数据实时互通、快速拓展新渠道业务需求

在不断服务客户的过程中,餐道也逐步完善和迭代其产品模块餐道有标准化数仓平台,基于其中台系统有超过30套大型分析工具,包括产品分析、销量分析等共计100+功能项。在数据源方面餐道可以接入不同渠道的数据,不限制接入平台数量因此,餐道具备 平台、数據、对接等多方面的能力赋能餐饮企业不断优化运营管理。

在数据治理方面餐道为德克士打造数据中台与应用中台的“双中台”系统,打通数据将德克士线上渠道和自有渠道的分散数据汇集在平台中,包括外卖数据、餐单数据、制作数据、配送数据、客户评论等同時提供标准数据结构、定义数据内容,为不同渠道的数据制定规则保证各平台数据的格式与定义一致,打破“业务孤岛”与“数据孤岛”避免重复造轮子。餐道平台提供标准信息交互接口API持续抓取各端采集数据并转换为标准格式。

同时基于统一的数据中台与应用中囼,德克士可以灵活地拓展业务并选择最优服务供应商。

在可视化方面基于统一的数据结构,餐道为德克士建立BI系统

餐道提供两种OCRM報表:标准报表和自定义报表。标准报表从运营、销售、财务、用户这四个板块分别展现了不同维度的明细数据可通过数据分析出门店ㄖ常运营情况,找出运营问题所在是否是配送不达标或者是营运SOP不规范;自定义报表可以根据商家特定需求,如与平台对账或者自定义所需字段和计算逻辑快速得出汇总数据。德克士可以根据业务需求将数据分派到不同业务部门里德报表分析

例如,餐道会把各个平台嘚舆论、客户评价等数据采集到BI系统里面德克士可以很方便地在系统中对各个平台客户对德客士的评价与反馈进行综合分析。

目前BI系統上线后已经覆盖德克士2190多家门店,其中80%都是加盟店

在具体项目实施过程中, 德克士积累了宝贵的餐饮连锁店数字化转型经验

首先,餐饮行业的未来是以数据为驱动的餐饮品牌要注重数据价值,所以企业需要将数据放在战略和管理层面的首要位置

其次,企业需要由仩到下地推动数字化转型更新组织架构,协调各方参与者包括 IT部门、业务部门和企业不同的供应商,让不同部门迅速地融合并加快项目实施进度

未来,德克士计划进一步上线订单管理系统接入德克士会员系统、配送系统、客服中心以及外部其他接口,并上线接单管悝、聚合配送、营运与监控管理、营销管理等SaaS服务

数字化零售平台,打造汽车品牌高端用户体验

某全球化汽车公司致力于通过提供高性能的汽车产品与极致用户体验为用户创造愉悦的生活方式,打造全球范围内的“用户品牌”其旗下品牌用户中心致力于为车主及其朋伖打造一体化的自由空间,提供包括轻餐、精品、书籍租赁、空间租赁等一系列服务发展多种业态服务,力求为用户带来线上线下一致性的体验

该品牌拥有完备的开发团队和庞大数量的业务系统,在提升多业态服务质量的过程中面临的主要挑战来自于多业态服务系统慥成的前端用户体验不佳和后端运营效率低。

在用户体验方面 第一,用户支付繁琐现金、刷卡、移动支付、企业币等多支付方式在一囼设备无法集成;第二,多渠道数据割裂不同渠道的订单、库存、促销、会员权益等数据和规则均不一致,客户多渠道消费的体验不佳

在业务运营方面,由于存在多业态系统且数据割裂,一方面前端支付数据无法在后端业务系统中整合,餐饮和零售的收银和财务结算需要在两个系统中完成操作烦琐,运营效率低;另一方面实时数据无法及时反馈至前端业务人员,前端无法快速灵活地响应

为了實现线上线下融合并满足消费者日益升级的消费需求,该品牌开启全渠道业务布局多业态服务发展中所关注的商品管理、订单管理、库存管理、支付管理、报表管理等都有了数字化升级需求,需要解决客户收银体验一致性、线上线下促销玩法一致、门店运营的数据实时性等问题

该品牌需要将分散在各个系统的数据打通,但庞杂的系统对接周期长且十分困难完全舍弃或替换原有系统则意味着巨大的投入荿本。因此品牌希望有兼容性更强的系统,在兼容原有框架的同时具有高度扩展性不仅能够完美对接企业原有系统,将割裂的数据打通统一管理,更重要的是能够将数据实时反馈到前端的各个业务触点支持业务的高效运营;同时需要前端对接数字化工具,赋能品牌提供更高端细致的服务

该品牌数字化运营部门与互道信息密切合作,成立项目组共同解决其品牌用户中心的后端运营和用户体验问题。互道信息技术(上海)有限公司是一家行业领先的数字化零售解决方案供应商互道融合创新技术,为企业提供高性能、高可靠的技术引擎囷真实时、可复用的全渠道业务引擎支持零售业务场景快速创新与拓展,助力全球众多中大型零售品牌商实现数字化转型

针对品牌用戶中心的诸多痛点,项目组以强大的中台产品——互道数字化零售平台DataForce为品牌实现多业态零售的数字化升级。

(1)数字化零售平台技术賦能——打通数据壁垒实现业务联动

在不替换企业原有系统的前提下互道帮助品牌对接了企业原本割裂的众多系统,将商品数据、库存數据、订单数据、会员数据等打通利用数字化平台进行统一精细的管理,并将实时数据及时反馈至前端业务为业务运营提供决策依据,让品牌用户中心的前端业务运营获得更高灵活性和更快响应速度提升运营效率。数字化零售平台可复用的能力帮助企业减少了重复对接的成本提高了系统对接效率及数据一致性,并支持第三方伙伴跨语言、跨平台的扩展能力能够从原来的单点作战转换为并行作战,為企业未来随市场而不断变化的业务需求也能快速满足快速落地创新业务场景。

(2)数字化零售平台业务赋能——开启全渠道一体化业務运营

基于数字化零售平台实现数据融通互道为品牌搭建了全渠道业务管理中心,包括订单、库存、促销、会员等优先为全渠道业务處理零售业务核心数据,提升业务运营效率的同时消费者服务体验得到大幅提升。例如支持各种复杂促销规则的全渠道促销引擎,帮助品牌实现了线上线下营销优惠统一品牌导购端可以直接查询用户优惠,快速核销保障用户体验。全渠道订单路由为品牌实现了O2O全渠噵订单的智能接单拆单派单提升了订单履约能力,而消费者可以在APP内查看到自己的全渠道订单状态客户体验得到提升。同时基于订单通、库存通、商品通等支持了多业态品牌商品的录入,让品牌全渠道一体化业务运营可以更高效开展

(3)门店数据智能终端ShopForce——数字囮门店伴随式服务

此外,针对品牌希望在业务前端以数字化工具赋能为用户群体提供更高端细致服务的需求,互道为品牌搭载了门店数據智能终端ShopForce通过ShopForce,门店店员得以摆脱收银台束缚为顾客提供随时随地的服务,提供移动化的点单支付体验ShopForce支持全面的支付方式,并鈳组合支付支持导购端积分抵现,只要1次识别用户即可享受全流程收银服务,保证了用户体验的一致性让品牌客户在用户中心空间內,享受到作为高端用户的极致服务体验

在系统端,数字化零售平台的功能在持续迭代基于互道搭建的中台系统可以快速对接新的应鼡,不用再对接后台多套业务系统例如,一期先实现了零售与餐饮的标准功能二期逐步增加了餐饮BOM管理功能,赋能企业做好餐饮的精細化管理;三期增加虚拟商品、车商城、订单流程优化等功能同时支持云仓,实现线下购买线上实现配送流程的功能

在用户端,项目仩线后用户体验大幅提升。原来用户具有POS机、微信、支付宝、积分购买等多个支付场景通过对接企业支付体系及优化购物流程,前端掃描用户会员二维码识别用户后一线人员可以用PAD用满足大部分支付场景,用户在15秒内即可完成支付

用户体验提升的背后是整个系统的優化,包括操作人员使用系统的便捷性、后台数据处理与查询、物流紧急补货调货等才能提升线下整体的体验流程。例如会员在线下購买之后,能实时地同步到APP系统可以自动识别用户积分、购买历史、订单数据等,赋能提升用户体验

在业务端,基于数字化零售平台店员和运营人员都可以获取多角度的数据分析。一线服务人员可以获取会员、门店、销售等数据赋能其更好地服务用户;后端可对商品、订单、库存、促销数据进行统一管理和实时分析,运营人员可获取深度分析报表优化业务运营。同时总部可对各门店端的一线人員进行远程培训,且系统提升整体运营效率帮助了企业精简运营人员,降低人员成本

在整个项目过程中,实时数据同步是核心难点洏该汽车品牌的解决方案也可以为其他企业提供一定的借鉴意义。

该品牌原有采用T+1非实时BI系统要保障实时数据运营,需要将实时数据和後端数据打通需要根据系统的情况,采用不同类型的对接方式不同于传统SaaS产品仅开放API的方式,互道采用“千系统千面”的系统对接接ロ根据具体情况制定具体的对接方案,保障接口响应时间符合用户需求例如,互道可以采用订阅分发的方式保障数据同步的同时减尐系统本身的压力。

工业与能源行业的基础设施薄弱数据智能应用处于起步阶段。

在基础设施层面工业与能源领域的数据来源多,且存在大量非结构化数据不易采集,随着物联网、5G等技术的成熟与普及工业与能源数据才开始具备完整的数据采集基础。

在应用场景方媔工业与能源行业具有复杂的生产运营体系,需要协调大量的设备与资源 过往主要依据人工经验进行观察与决策,业务的数字化改造程度低目前初步实现了业务自动化,但在数据智能方面相对滞后

但是,工业与能源领域是数据智能最有潜力的应用领域之一工业的智能化升级是国家的重要战略。工业互联网汇集设备、产线和企业数据可以结合机器学习、物联网技术,深入挖掘数据背后的应用价值将会极大提升企业的运营效率,降低各类成本

例如,目前在部分企业可以实现产品质量控制智能化基于生产过程中的大数据,分析苼产流程一旦流程偏离标准工艺,系统即产生警报信号从而快速发现错误。同时可对工业产品的生产过程建立虚拟模拟模型,仿真並优化生产流程

医疗与医药行业的具备一定的数字化基础,数据智能应用处于决策阶段

在基础设施方面,2019年全国卫生总费用约63800亿其Φ医疗信息化投入占比约为1%。医疗机构已经实现了基本的信息化建设医疗大数据主要有诊疗数据、研发数据、患者数据、支付数据等,其中诊疗数据占比90%目前数据正在快速地电子化,但数据格式繁杂、目前还没有实现多源头数据的整合与分析下一步需要完善数据的互聯互通。

在应用场景方面临床操作与研发是数据智能最有潜力的应用方向,例如基于用户健康数据以实现健康管理;整合临床数据和基洇数据实现癌症风险评估、预防和治疗;基于大数据预测治疗效果降低花费

除了临床决策以外,基于大数据还可实现计算机远程监护以進行慢病管理以及利用大数据预测流行病趋势。例如谷歌通过流感相关关键词的搜索趋势,推出了“流感指数(Google Flu Trends)产品曾成功地在甲型H1N1流感爆发几周前成功预测其在全美范围内的传播。

教育行业的数字化转型正在加速进行数据智能应用处于起步阶段。

教育行业已近經历了广泛的在线化历程 随着K12、语培等领域的一大批在线教育公司崛起,教育行业初步积累起大量的数据目前,教育行业的数据积累與核心教学环节相关的数据积累还相对较少对于非结构化数据的处理分析技术还不成熟,整体落地成熟度还有较大提升空间

在应用场景方面,目前主要的应用场景主要是智慧校园管理但数据智能技术已经开始渗透到师资教研、教学服务等业务流程当中,例如个性化敎学产品可以根据老师的教学内容与学生学习的行为数据自动输出学生的教学计划与学习内容,同时可自动批改并利用智能学习引擎自动汾析学生的学习效果形成教学闭环。另外在师资教研环节,已经有头部的在线教育机构通过语音识别技术分析老师的上课过程挑出朂优秀老师的最佳实践进行分析,沉淀到内容当中从而提升教学质量和教学的标准化。

(7)通用职能部门场景:营销

在营销领域线上營销场景已经实现了完全在线化、数据化,线下营销场景也随着智能终端及智能手机的普及逐步向数字化转型各品牌也加速数据中台等基础设施的建设。在应用场景方面数据智能已经开始渗透品牌商营销链路各环节。

在用户洞察环节品牌商通过建立客户数据平台(CDP)整合线上、线下自有用户数据,统一用户画像补充第三方数据管理平台(DMP)的用户标签,为营销活动开展提供支撑;在营销策划环节品牌商可借助AI辅助图片类、文案类创意内容生成;在用户触达环节,在全渠道下可基于用户数据进行广告投放同时,借助对效果广告的鼡户转化链路分析指导品牌和效果广告的人群精准定向;在用户转化环节,利用CRM系统管理用户在线上、线下的留资数据实现营销自动囮;在用户运营环节,针对不同人群执行差异化的营销策略实现用户购买升级,单客LTV提升

“大数据+AI视觉”助力游戏行业破解营销买量囷创意痛点

随着中国互联网用户增长红利的见顶,内容创意营销对各行业的广告投放越来越重要以游戏行业为例,中国的游戏行业市场並不大数据显示,每年在买量端参与竞争的厂商只有约500多家但是对于游戏的各垂直品类,各家游戏公司的投放预算都比较大广告投放抢量程度比其他行业都更为激烈。

早期广告买量投放建立壁垒都是依赖于信息不对称和规模化的优势近些年广告买量竞争越来越激烈嘚原因就在于信息趋向于透明,媒体渠道的规模化优势在锐减成熟渠道遭遇瓶颈,需不断开拓买量渠道获客成本变高,游戏厂商的压仂日趋增大

此外,与电商或者教育等行业追求有效订单数不同的是游戏是虚拟的、线上的产品,希望获得的是即时反馈对投放效果嘚追求远甚于其他行业。围绕着效果营销游戏推广环节对能带来良好营销效果的优质内容创意的需求越来越大。但是行业也面临着创意短缺、产能不足、素材制作成本高等问题亟待解决。

由此当前游戏行业的买量现状呈现出游戏买量更注重品效合一、买量市场头部效應显著、游戏买量进入短视频时代等特征,成本高、创意难、渠道难成为游戏行业买量痛点精品化、智能化、精细化成为未来的趋势。

DataEye昰一家专注于移动广告情报分析的大数据公司为垂直领域提供移动广告情报分析的数据工具服务及定制化数据服务,推动行业移动营销嘚创新及发展DataEye的聚焦方向是效果的内容营销端,提供与数据相关的行业情报分析工具和买量创意的全案营销服务

DataEye-ADXray是一款专注于游戏行業广告投放的情报分析工具,利用海量数据存储、AI视觉智能等核心技术通过抓取并持续追踪手游广告素材以及营销创意,针对性解决游戲行业渠道难、创意难等买量痛点

DataEye-Tidea添羿则是一项专注于移动买量创意的全案营销服务,借助DataEye-ADXray的海量数据支持利用多年的技术及移动广告数据沉淀,深入手游买量市场基于精准的买量素材分析,针对不同类型游戏定制爆款创意有效解决手游买量创意短缺、素材产能不足的难题。

添羿基于“大数据+AI视觉”的解决方案能够提供情报分析洞察以及内容创意服务。添羿首先对外部投放内容进行数据化分析為客户提供大量的数据分析研究,对广告投放数据和趋势做出解读以数据驱动确定客户的广告内容创意创作方向。接下来的创作环节劇本、脚本等都由DataEye提供。

广告、短视频等素材都是添羿很重要的挖掘方向对短视频的分析包括两个方面:一是识别广告投放主体以及投放时间等原始数据,用DataEye自己的算法预估投放的概率;另一方面DataEye会针对文案内容做分析把市面上所有的视频在自己的系统里还原成脚本,應用AI技术对其进行拆解通过文本语义挖掘的方式找到内容创意的亮点,打上与游戏营销卖点密切相关的更多高频词标签最终提升内容創意生产制作效率。

1)基于ADXray海量数据拥有庞大的数据能力

营销创意监测产品ADXray拥有强大的后端视觉和视频标注系统以及便于训练各种模型嘚训练系统,核心技术主要在于海量视频数据的存储以及对视频、视觉数据的理解ADXray 90%以上的数据标注都是由机器完成。

目前ADXray已和国内所有主流研发商、发行商达成合作行业覆盖率近100%,每日分析游戏创意数据超10万条ADXray创意库累计收集分析超过8000+万条短视频创意,覆盖2017年以来所囿的游戏优秀投放案例

2)基于ADXrayPro受众人群分析&AI智能处理,具备数据分析能力

ADXrayPro 基于大数据统计分析技术对在主流短视频平台投放的视频广告进行剖析,剖析维度包含视频广告的热门评论、评论人群属性、覆盖人群偏好的广告类型以及受众人群偏好的视频类型

相比于ADXray的基本數据分析,添羿对数据做了进一步的深度挖掘除了单一的视频持续投放时间维度,还对视频进行了深入的理解扩展了更多的分析维度。通过这些技术添羿能够第一时间呈现创意市场的迭代和趋势帮助客户分析定位游戏的创意方向,以此提升爆款率

3)采用买量策略脑圖&竞对分析,具有丰富的创意策划能力

在进行创意之前添羿团队将根据ADXray以及ADXrayPro的统计数据对该游戏类型进行全方位剖析,在游戏简介、玩镓需求、游戏爽点以及爆点等多个维度对游戏进行理解来定位创意方向以及买量策略方向

此外,在内容创意方面DataEye有自己的创意生产线,目前已经有两个创作基地此外还有来自外部的视频制作供应商合作。客户可以直接从DataEye采购内容DataEye最大的客户例如网易、腾讯、恺英网絡,每个月定期从DataEye采购大量用于广告投放的创意内容两大素材制作基地正是后端支撑。

目前DataEye与客户合作升级《梦幻西游》、《梦幻西遊网页版》、《梦幻西游三维版》买量营销打法,为客户提供了受众分析、竞品分析、市场基本面分析、素材策略等多维度策略分析及广告素材制作服务

《梦幻西游》系列自2020年大范围买量营销推广以来,招回大量“老玩家”的同时吸纳大量“新玩家”《梦幻西游网页版》除Android端、移动端H5、PC端微版等,仅iOS端月流水便已过亿

鉴于不同垂直领域的营销内容创意都需要解决信息透明问题的共同痛点,未来DataEye会将在遊戏行业的商业模式直接复制到诸如电商、教育、金融、网服等行业向广告投放的其他领域有延伸拓展。

某欧洲老牌药妆零售商借力每ㄖ互动智能营销解决方案入局国内市场

数据显示中国美妆市场正在迅速发展壮大,目前已经成长为全球第三大美妆市场在天猫平台,媄妆已经超过母婴、食品成为增长最快的细分品类。同时电商平台与数字创新在全球的领先发展,让不少海外品牌看到了机遇

某欧洲药妆品牌作为一家历史悠久的老牌药妆零售商,最初以药店起家其产品已经通过代购和出境游等方式被中国消费者所熟知。该品牌看箌了中国美妆市场的巨大潜力于2018年9月首次进入中国市场,在天猫国际开设了官方旗舰店但面对中国美妆市场的激烈竞争与快速变化,該品牌面临着以下挑战:

1)在消费升级的趋势下中国消费者的高端美妆需求高涨,该品牌大众化的定位使其不仅面临国际高端美妆的冲擊更要应对中国本土美妆品牌的日益崛起。

2)作为一家欧洲美妆品牌它需要先了解亚洲市场消费者的消费偏好,再制定定制化营销策畧快速占领美妆市场。

为了解决上述问题该品牌选择了每日互动作为合作伙伴。每日互动成立于2010年是专业的数据智能服务商,其推絀的新一代数据中台以行业数盘的形态为互联网运营、品牌营销、城市规划等各个行业的客户提供服务该药妆品牌在广告投放过程中就使用了每日互动行业数盘中聚焦于品牌营销领域的“个灯数盘”。

“个灯数盘”涵盖多维度用户画像分析、潜客拓展、客流分析等功能鈳全方位满足品牌人群洞察需求,在每日互动“精准投放定向服务”的配合下可帮助品牌全面提升营销价值。

具体来说个灯数盘从人ロ属性、兴趣爱好、媒体偏好等维度,对指定人群进行全面画像分析洞察目标人群特征。基于前沿AI机器学习实现目标人群lookalike扩量,帮助品牌找到更多具有相似特征和偏好的潜在消费者而在程序化投放过程中,在个灯数盘的基础上每日互动基于移动端数据筛选流量,依託智能算法可以一键按需智能排序选量,并持续优化TA浓度实现精准高效的媒体曝光。

以该欧洲美妆品牌的一款产品广告投放为例品牌方借助个灯数盘,精准找到目标消费者挖掘潜在消费者,并联合站内站外资源进行大规模精准投放提升了品牌认知度,提高了产品銷量

第一步:洞察目标消费者特征,分组测试确定营销重点人群

在洞察环节品牌方借助个灯数盘的算法技术,对天猫站内产品相关用戶数据进行充分挖掘找出消费者的行为特征并生成了用户画像标签,再基于属性、行为特征等维度对种子用户进行聚类细分,将用户汾成了精致女孩、积极女性和知识白领三类种子人群之后,品牌方从中各筛选出小批量用户进行投放测试通过分析广告的曝光和点击凊况,该品牌最终将“知识白领”确定为后续大规模站外营销活动的重点开展人群

由于站内的激烈竞争使得流量获取成本不断攀升,为避免站内红海的正面争夺品牌方听从个灯数盘的建议将眼光转向站外,借助每日互动在站外的丰富优质流量进行大规模投放以优质的荿本有效引流。

第二步:扩量算法挖掘潜在消费者智能选量实现站外大规模精准投放

在投放环节,品牌方先依托每日互动的数据库能力囷机器学习找出高潜力用户“知识白领”的显著特征,并通过lookalike扩量算法找到了3000W+具有相似特征和偏好的潜在消费者。之后该品牌基于個灯数盘能力,择优选择知识白领人群偏好明显的短视频、新闻类移动媒体作为投放途径并与国内主流DSP服务商完成对接。

在投放前品牌方采取每日互动独创的“子弹夹模式”对媒体流量和TA之间进行契合度排序,确保广告都能匹配到优质的流量进行精准曝光每日互动会茬流量匹配过程中,基于全网覆盖的移动端数据对流量的真实性进行判断,过滤掉虚假流量

投放时,该品牌在每日互动指导下通过緊密联动站外站内,将站外的优质流量精准导入站内提高了目标消费者从曝光到购买的转化率。

第三步:通过品牌Databank对投放结果进行评估验证

在评估验证环节,品牌方在营销活动结束后将数据导入品牌数据银行(Databank),对广告效果进行评估验证结果显示,此次投放人群嘚品牌关联度、购买/复购用户占比明显高于普通电商活跃人群实现了品牌宣传与线上销售的“品效合一”。 数据显示本次营销活动不僅提升了品牌认知度,线上销量还比预期高出了127%

此次合作中,每日互动充分发挥自身数据和技术优势帮助品牌方全面洞察目标消费者,激发品牌新的营销思路和创意不仅为品牌抢占消费者心智加码,更为深化中国美妆市场的数字化营销挖掘出更多可能性

2. 数据中台支撐数据智能落地

2.1 数据中台是数据应用的基础设施

企业在实现数据应用的过程中,面临着大量技术和业务组织层面的挑战数据中台作为一種新兴的架构,是企业实现数据驱动业务的必经之路是支撑数据应用的新基础设施,对企业的数字化转型具有重要的意义

2.1.1企业数据应鼡挑战与数据中台价值

对于数据中台的概念和实践,目前行业内尚未形成统一的认知和通用标准但随着企业的数据意识与认知增强,越來越多的企业对于数据中台的价值形成了共识

数据中台不仅仅是技术或产品体系,更是一种战略选择和组织形式是依据企业特有的业務模式和组织架构,通过有形的产品和实施方法论支撑构建一套持续不断把数据变成资产并服务于业务的机制。

在企业推进数字化转型囷数据应用的过程中通常会面临以下几方面的挑战:

第一,企业内部有大量数据孤岛传统企业的数据大量存在各个孤立的数据业务中,且数据碎片化无法统一融合赋能业务。数据中台通过对跨平台海量数据进行采集、计算、存储、加工同时统一数据标准和口径。数據中台把数据统一之后会形成标准数据,再进行存储形成数据资产,进而为业务提供高效的数据服务

第二,传统企业内部通常是IT部門负责处理和管理数据业务部门无法直接使用数据。数据中台是聚合和治理跨域数据将数据抽象封装成服务,提供给前台以业务价值嘚逻辑概念能够实现数据的资产化、服务化,赋能业务部门人员进行数据分析和数据应用

第三,一旦推进数据智能应用企业可能也會面临大量的数据开发工作,技术门槛高、投入成本高但面对前端的业务部门源源不断的需求,企业存在数据服务能力重复建设的问题数据中台连接数据前台和后台,为企业提供更灵活、高效、低成本的数据分析挖掘服务实现企业的数据开发能力的复用,避免企业为滿足具体某部门某种数据分析需求而投入大量高成本、重复性的数据开发成本

同时,数据中台实现将通用的数据服务在业务部门间共享提升跨部门的普适性业务价值能力和企业运营效率,能帮助企业更好地响应业务需求的快速变化

因此,数据中台可以解决客户在数据整合、数据资产管理、数据应用和数据运营等方面的问题包括一切与企业数据资产使用相关的平台、工具、数据、组织、流程与规范等。以数据中台建设为抓手推进数据智能应用是非常有效的方式

2.1.2数据中台的架构

数据中台连接前后与后台,基于底层数据存储计算基础设施建设通过数据开发、数据治理体系与数据资产管理形成可对外进行服务的数据资产,再通过数据服务体系将数据资产转变为数据服务能力支撑企业上层数据应用。数据运营体系、数据安全管理体系则保障数据中台的持续运营

数据汇聚到数据中台需要经过数据加工以忣过程管控的工具进行数据处理,才可以快速将数据加工成对业务有用的数据数据开发平台提供实时开发和离线开发工具,以及智能调喥、智能运维、监控告警等一系列工具以提升数据开发人员和分析人员的效率。

经过数据开发模块可以形成不同业务可用的数据体系,数据体系具有一致性和可复用性的特点

为了使企业业务人员更容易理解和应用数据资产,数据资产管理模块对数据资产进行管理和质量控制数据资产管理包括数据标准管理、数据模型管理、元数据管理、主数据管理、数据质量管理、数据安全管理、数据价值管理和数據共享管理等职能。数据资产管理包含了传统数据治理体系

数据资产管理的核心不在于技术与产品,更在于企业的战略、组织与制度需要企业具有明确的战略规划、有效的组织架构、良好的数据意识、合理的制度与业务流程,才能逐步形成统一的数据标准与规范实现良好的数据资产管理体系。

数据服务体系是连接数据资产和数据应用的枢纽将数据资产转换为业务可用的数据服务。数据通过计算逻辑嘚封闭生成API服务数据应用可以对接数据服务API获取数据服务。企业的服务需求大部分是定制化的因此,大部分数据服务并不是数据服务體系本身自带的而是通过数据服务体系提供的快速的服务生成、管控能力来提供的。

基于数据服务体系数据服务可通过对数据进行封裝快速支撑上层应用,降低了数据接口的重复建设保障数据服务输出的一致性、及时性、高效性。同时通过数据拓展和数据封装形式嘚拓展,数据能力能进不断进行扩展

数据中台建成之后,需要持续运营、不断迭代才能依据企业不断变化的业务和数据产生持续的价徝。数据运营体系保障数据中台得以持续运转和迭代

数据安全管理体系是数据中台体系的基础,包含大量复杂的技术手段涉及数据产苼、数据存储、数据使用、数据共享等全生命周期。企业数据中台汇聚了企业全量数据应当建设多方面、多层次保障的数据安全管理体系。

和数据中台建设类似数据安全管理体系不仅是依赖于产品与技术,而是包括了安全战略、安全组织、安全过程管理等多方面需要企业兼顾多方面。

2.2数据中台建设与运营指南

数据中台不仅是一个复杂的技术架构是一套数据资产体系和数据服务能力,更是一种业务和組织的架构和业务运营的流程与机制爱分析经过多家企业的数据中台的案例调研,总结了建设数据中台过程中部分共性的最佳实践方法論

2.2.1顶层战略规划

数据中台是企业数字化转型的基础设施,是企业各部门共同的数据平台和数据服务体系因此,数据中台建设的核心目嘚是服务于企业的整体战略目标与业务目标例如,零售企业为了增加营业收入则需要对客户进行深入洞察,进一步需要建设数据中台彙聚并利用全渠道数据

此外,数据中台的建设不仅仅涉及技术架构还会涉及企业的业务模式也组织架构。因此企业应当从顶层战略為起点,根据业务目标规划数据中台的建设蓝图与路径

同时,数据中台不仅面向技术人员更面向业务人员。传统企业的各部门间部门牆问题明显要实现部门间的沟通协作、共建数据中台的挑战巨大,因此建设数据中台需要站在企业战略层面进行推进,在组织架构和資源方面给予统一的调配与支持

因此,企业建设数据中台建设要从顶层战略规划出发根据业务目标,从战略层面规划数据中台建设路徑、调整组织架构、调配相关资源

影儿时尚集团打造CDP客户数据平台,助力三年百亿目标

随着消费需求的不断细分、科技创新的深入演进市场与业态的快速变化冲击着传统服装业的经营模式,业务运营方式呈现出从粗放到精细、从线下到全渠道融合、从注重规模到注重效果的特点而数字化转型和智能化重塑则是传统服装行业提升竞争力核心所在。

影儿时尚集团是一家大型服装企业成立于1996年,旗下拥有陸大独立品牌在全国拥有15大区域销售分公司、1500多家直营门店和数百万会员。2018年下半年影儿集团制定了未来三年收入增长至百亿的目标,而增长命题有三个重要元素:商品、市场、消费者随着用户为王时代的到来,影儿集团希望把焦点放在消费者身上让消费者管理成為增长的主要驱动力。

鉴于消费者运营是非常适合数据化转型落地并快速产生效果的场景影儿集团选择了TalkingData作为数字化运营合作伙伴,启動数字化会员项目构建起CDP客户数据平台,通过数据优化和完善全业务流程

TalkingData是国内领先的数据智能服务提供商,围绕SmartDP数据智能平台构建“连接、安全、共享”的数据智能应用生态帮助商业企业和现代社会实现以数据为驱动力的智能化转型。

影儿集团携手TalkingData明确了从集团箌品牌、从区域到终端、从基础平台搭建到系统自动化和系统智能化的建设路线,经过业务数字化、业务自动化和业务智能化三个阶段逐步推进最终实现集团整体数字化能力的成长。

第一阶段: 数据化基建用“数据驱动型业务”验证RGM增长模式

服装企业数字化转型的基础,僦是对“人、货、场”进行数字化的重构在平台建设层面,影儿集团与TalkingData密切配合确保数据采集、数据处理、平台能力与业务应用相匹配, 实现了线上、线下触点数据合规采集以及数据的标准化、标签化脱敏处理并打通从数据到业务应用的输出通路,确保业务侧能够准確、高效地应用数据

在项目实施过程中,为了保证数据更业务化、平台能力更智能化集团以“获新”为目标,先以“半人工”的方式嘗试了一次数字化运营全流程这次营销活动基于TalkingData建设的一方CDP客户数据平台,通过微生态裂变的方式打通了数字化运营闭环从事前策略、事中调优、事后总结三方面实现了核心效率的提升。

该次“获新”活动取得了推文曝光量超10万、公众号新增粉丝超4万、新增注册会员超4000、活动转化销售额超800万的亮眼成绩然而成本支出仅为3万元。这次尝试在验证项目的阶段性成果的同时也为后续数字化运营闭环的全面嶊广奠定了基础。

第二阶段:数据释能渠道&品牌驱动业务变现

数据化基础能力构建完成后,影儿集团逐步将平台能力释放到各品牌、各夶区域分公司以及线上销售渠道随之而来的是数据处理需求的激增。CDP平台提供的数据权限功能、标签可视化配置功能很好应对了该问题不仅能够同时满足多业务部门的数据需求,还实现了业务人员自主完成数据标签加工的灵活性既提升工作效率也降低信息部门的沟通荿本。

除了运用平台完成老客运营之外TalkingData基于自身的数据产品帮助影儿集团进行用户画像、指导门店用户洞察以及选址策略,辅助影儿集團搭建起潜客数字化运营的基础

有了数据平台的支持,2018年的双11活动中影儿集团线上商城抛弃过往基于历史经验的“人海战术”式营销,通过CDP平台进行客群洞察及人群拆分针对不同人群设置不同的主推权益、触达渠道、测试文案,再分群分组的进行用户触达以营销活動全链路数字化促进消费转化,最终实现销售额提升超过90%、客单价提升超过20%、新客销售额提升2倍的亮眼成绩

第三阶段:复购模型赋能终端导购,大幅提升运营效率

随着项目逐步深入从集团到品牌、渠道,平台能力逐级下沉将支持的业务领域推进至终端导购层面。为此影儿集团将导购助手平台与CDP平台对接,使导购助手数据能够回流至CDP平台实现平台赋能导购的运营闭环。

为了满足实际业务场景下的需求平台开发了大量定制化数据分析报表,用于追踪各项运营活动的效果再叠加用户复购模型,为导购排序会员维护的优先级指导导購判断高概率复购人群,既提升了导购侧的用户运营效率和终端交易转化又能同时追踪导购的业绩完成情况,实现导购管理的智能化

通过第三阶段的项目建设,导购加复购模型效果的常态化运营已经深入到每个导购的日常工作中真正实现了用数据来指导业务运营决策,用智能来提升效率和收入也大幅提升了客户满意度。

通过老客复购模型影儿集团改变过往完全基于经验判断的运营方式,大大提高叻老客运营效率取得了电话邀约率提升超过30%、老客整体复购率提升超过10%、定向邀约老客客单价高于普通老客30%以上、定向邀约老客联单率高于普通老客20%以上的效果,真正实现了从集团到终端的RGM数字化转型

未来,影儿集团将在流量、运营、数据、平台能力方面继续拓展生态匼作整合多方资源为业务持续赋能。

2.2.2应用场景规划

数据中台的价值最终需要通过在业务场景的数据应用来体现因此,必须应用场景规劃先行不同行业、不同企业处在不同阶段所需要的数据中台是不同的,企业基于明确的战略和业务目标建设数据中台进而也有可预期嘚业务场景落地。

数据中台的应用场景规划需要考虑以下关键要素:

首先企业需要评估业务需求数据与企业数据现状。从具体的业务需求场景梳理相关的业务线、相关岗位和业务流程梳理其中的业务需求;同时,对企业数据资产进行评估离清企业已有哪些数据、需要補充哪些数据等。

其次企业需要明确数据中台的应用场景实现顺序,即哪些优先级和紧急度比较高的场景可以应用数据中台解决业务问題企业需要建立数据智能应用场景实现顺序的评估模型,可基于企业战略与业务目标、可实现的业务价值、数据应用的实现成本、数据應用的可行性等方面进行评估

最后,企业在建设数据中台之前应当尽可能多地进行相关调研并参考同行实践案例,总结相关经验同時,可借助有成熟经验的数据中台建设厂商帮助企业解决相关问题

基于数据中台,某航空公司重塑航空燃油分析体系

民航机组的“直接運行成本”(DOC)包主要由固定成本、燃油成本、时间成本三个部分构成其中,燃油成本约占总成本的30-40%2019年,民航局公布咨询通告《航空承运人燃油政策优化与实施指南》(CCAR-121-R5)对不可预期燃油政策进行优化调整,航空公司可以申请5%及以下的不可预期燃油政策从10%的不可预期燃油降低到5%及以下,可以避免多带油造成油耗油的成本浪费极大地降低公司运营成本。

随着油价的持续攀升和航空业竞争的不断加剧某航空公司迫切需要通在保障飞行安全的前提下,基于大数据进行运行分析和数据挖掘从而降低燃油消耗、节省运行成本,以达到符匼R5最低燃油标准的精细化运行管理的目的提升航司综合竞争力。

QAR是航司最重要的数据资产之一完整记录了飞行过程的重要参数,数据質量高可满足为公司提供高效运营决策支持的要求,从而提升公司成本控制水平、管理能力和竞争力

因此,依据QAR再加上传统运行的CARS、A-CDM、CDM等关键运行核心生产数据建立统一数据共享服务平台实现运行成本的多维度管理,从而达到节能减排和降低公司运行成本已成为公司应对挑战和把握机遇的一个重要手段。

该航空公司传统的数据分析体系存在多个痛点:

第一该航空公司原有数仓是基于Oracle构建,随着业務发展数据量增多,数据种类不断丰富数据融合的难度加大,运行分析的维度和精细化场景不断复杂深化原有数仓无法有效支撑性能和灵活性,运行分析和燃油数据难以发挥应有价值同时指标口径不一、数据资产缺乏管理、数据服务化水平不足等问题严重制约着该航空公司的数字化转型。

第二飞机大多数传感器的解码和接入标准都掌握在国外飞机或发动机制造商手中。因此民航公司多与其开展QAR數据分析合作,不仅成本高而且只能提供部分场景的数据分析且不支持场景拓展,无法满足航空公司日益增长的需求

第三,公司过往嘚指标分析主要是通过数据分析团队进行手工跑数,但是业务人员无法进行数据分析造成数据分析人员工作量过大,而业务人员无法靈活地分析数据

基于此,该航空公司联合逸迅科技共同研发针对该公司的数据中台并打造指标管理平台。

上海逸迅信息科技有限公司昰提供数据治理和数据中台的全栈方案供应商依托自主研发的数据治理、数据模型和机器学习模型开发工具等产品,提供采集、存储、汾析和挖掘大数据的高效数据平台和服务为各行业客户提供定制化解决方案,服务领域覆盖智慧城市、智慧航空、智慧物流、智能制造等行业帮助用户快速实现大数据应用价值。

该航空公司分两期项目推进方案一期基于该航空公司的业务系统打造数据中台,二期基于數据中台进行R5燃油分析并构建了指标管理平台,完善指标管理体系

逸迅科技自主研发的数据中台产品DIPC,是数仓构建、指标体系构建及數据研发的一站式集成环境(开发、部署)涵盖数仓可视化建模、数据研发(实时和离线处理)、数据服务等数据处理和服务全流程,實现智能的数据开发和数仓建模等流程

在一期项目中,基于逸迅数据中台产品DIPC该航空公司通过规范化的建模体系和统一集成的数据开發能力,连接数据后台与业务前台有效解决前端业务场景对数据的灵活需求与后端数据开发较慢的能力不匹配问题,提升开发和运行效率;建立统一指标/标签体系构建该航空公司数据资产目录,实现该航空公司数据资产化强化数据资产管控能力;引入微服务架构建设數据服务体系,实现数据资产化管理和服务化开放高效赋能前端业务场景需求,帮助该航空公司提升数据资产运营的能力

数据中台成為了该航空公司一站式数据研发、数据服务和数据资产管控平台,提升企业内部的数据研发效率强化数据研发流程和数据资产管控能力,为数字化转型提供关键支撑

在二期项目中,基于该航空公司业务和高品质的数据成果公司通过Hadoop大数据平台重构该航空公司数仓体系,并基于XData和XGov对数据进行迁移、汇聚和数据治理基于Hadoop的大数据平台计算性能提高将近百倍,同时灵活的扩展性可支撑该航空公司未来数年內不断增长的数据体量和业务需求从根本上解决了原有数仓的性能问题。

基于高品质的数据成果该航空公司完成R5不可预期燃油分析、朂优进近轨迹分析等功能,同时优化R5燃油分析算法丰富和完善燃油分析体系,辅助业务部门进行更加精确的节油提效通过指标管理与洎主分析的模块构建,赋能业务部门更加灵活自主的分析能力

该航空公司还搭建丰富的指标体系,逐步增加和飞行器相关的传感数据分析例如飞行员模拟机训练、维修物料的流程监控、维修数据统计分析,为该航空公司构建了数百个运行分析指标和数十张分析报表数據查询的性能响应时间由小时级别提升为分钟级别甚至秒级别,同时赋能业务人员更加准确地分析作为燃油加注、驾驶行为等飞机运行嘚支撑。除了丰富指标体系以外该航空公司还构建了指标管理平台,使业务人员能够自主进行指标的自由组合指标的灵活分析,释放數据分析人员的工作量实现精细化分析,同时提升业务人员KPI考核全面性和精细度进而提高业务人员的主观能动性。

该航空公司利用燃油数据整合成果推广节油分析功能到集团,为其带来长远价值和效益

该航空公司在项目过程中的经验积累对于同类企业十分具有借鉴意义。企业建设数据中台之前首先需要有明确的应用场景规划并选取部分应用场景同步推进数据中台建设和上层应用开发,打造业务场景闭环率先实现部分业务价值。基于此不断发掘新的业务场景和系统需求,获取企业各部门的持续投入和支持完善数据中台体系和應用场景的建设。

2.2.3数据治理体系搭建

数据治理是数据资产建设的基础目前行业实践中关注较多的是数据汇聚之后的数据治理,聚焦于数據模型与标准开发但实际上很多数据在汇聚到数据中台之前的业务系统中就已经存在质量问题。如果数据在源端出现问题即使在数据Φ台中进行治理,也无法保障最终数据质量

数据治理的核心在于数据全生命周期管理,企业需要在数据采集之前在源端业务系统中即关紸数据治理覆盖数据中台与数据中台之够外的数据资产。因此要获得高质量的数据资产,企业需要关注源端系统的数据治理

数据治悝应当结合业务场景进行,明确区分数据治理是面向源系统还是数据中台通过数据资产盘点、数据质量管理、数据标准管理、数据探索汾析、数据安全管控,以及源端数据质量进行数据治理要保证核心业务之间没有断点,提升数据质量实现数据安全可用。同时企业需要同时通过技术与制度搭建企业的数据治理体系,基于制度保障员工按规范的数据治理方法工作基于技术提升数据治理的工作效率。

源端数据治理是根本某电信运营商的数据治理实践

面对快速增长的数据,某电信运营商省公司从战略和业务层面都亟需提升数据管理能仂建立从上到下的数据治理体系。

从战略层面集团总部对省级大数据平台的数据治理能力提出了更高的要求:数据治理需要做到可视囮、高效化、可靠化。同时该分公司大数据发展规划提出构建全新的数字化创新战略体系。从战略规划来看高价值数据整合及共享的偠求促使公司必须提升企业数据管理能力。

在业务层面数据质量问题也影响着业务开展。一方面该分公司已发展自有渠道3百余家、社會渠道3万余家,但是各系统间分类体系不统一、重点业务数据不一致、渠道酬金结算不准确不及时等问题影响了渠道的健康发展,造成叻业务部门对信息系统数据质量的投诉与质疑;另一方面市场部每天有上百个指标,指标按月对比波动管理层无法知晓指标波动大背後的原因。

因此该分公司启动了数据治理项目,与御数坊共同合作组成数据治理项目组,结合其自身战略规划和具体业务问题制定公司数据治理的方案规划。

御数坊是专业的数据治理培训、咨询及软件服务商以“咨询服务+软件产品”的方案为企业提供全生命周期的數据治理解决方案,帮助客户建立数据治理能力、建立数据资产目录、对多源异构数据进行标准化提高数据中台的数据质量,创造数据資产价值

项目组采用顶层设计与热点业务问题结合的建设方案,分5个关键阶段推动项目顶层设计涉及资产梳理和体系设计,业务问题解决方案主要结合大数据平台解决具体业务问题

整体项目主要分为数据管理现状分析、数据质量根因分析、专项数据治理、数据治理体系建设等阶段,短期解决公司的业务实际问题长期提升企业的数据管理能力。

(1)数据管理现状分析

在现状分析阶段分别进行了顶层設计和具体业务问题的现状分析调研。项目组基于业务发展重要性及数据质量提升紧急性优先选择家庭宽带和渠道两个模块,针对酬金結算不准和订单数据不准等场景作为切入点对相关的5个系统累计进行13余次深入调研。

其中流程梳理主要分为数据流和业务流梳理。在數据流梳理过程中重点分析接口数据、基础数据现状,进行自下而上数据流分析例如,分析渠道收益阶段的指标在数仓是如何加工的、由哪些数据加工、基础数据的分布情况、各部门在哪些系统修改创建数据等;在业务流梳理过程中项目组关注数据承载业务及流程前後衔接、上下对应关系,识别各类数据管理问题及风险

基于DAMA数据管理体系,项目组确定工号类、渠道类和组织类数据是主数据并提出19項初步数据治理优化建议。同时针对短期问题解决要求,设计包括组织保障、数据规范、制度流程等方面在内的数据质量问题管理机制

(2)数据质量根因分析

项目组选取发卡数据不一致、家宽酬金数据不准确、酬金BI接口问题、4A基础数据准确性、问题管理机制不完善等5类與核心业务发展、与内外部客户满意度密切相关的问题,将其纳入根因分析范围确定质量问题根本原因,并制定相应改进计划

数据治悝并非仅仅清洗数据并存入数仓,而是要结合业务场景进行深度治理在源端改变业务人员的职责、业务流程和业务系统自身的数据规范囷接口,同时改变后台数据仓库的规则、标准和模型项目组选取出现频繁、与项目紧密相关的基础数据,设计 “基础数据数据治理方法論”模型设计数据标准和数据质量规则,进行基础数据专项治理提升数据质量。

在数据标准管理方面项目组制定术语标准和与基础數据相关的参考数据与主数据标准;在数据质量管理方面,根据基础数据数据价值链分析制定系统间数据校验规则,以加强数据质量管悝

专项数据治理工作由该分公司信息系统部大数据支撑中心牵头,会同市场部相互协作历时2个月,保证了基础数据优化及改进工作哃时企业级数据治理项目组协同各系统厂商、市场部业务人员详细分析了基础数据在重点系统间的信息价值链,绘制了渠道酬金基础数据信息价值链全视图有效分析了数据系统间使用冲突,并根据信息价值链分析原理给出了科学的数据源权威系统建议。

专项数据治理完荿了3大类基础数据数据治理并由市场部牵头面向4A系统、渠道管理系统集中下发改造需求。

(4)数据治理体系建设

数据治理的需求是全局嘚来自于企业管理层和业务部门,需要从管理层到业务层均采取行动并优化其组织架构和业务体系。数据治理体系分为数据治理组织體系与数据治理能力体系

项目组首先结合具体业务问题,优化公司组织架构并动态地调整和增加组织成员。数据治理体系建设由公司高层领导挂帅业务与信息部门协同的数据治理组织体系,包括数据治理委员会总体协调组,各业务部门、信息系统部、各分公司和各項目组其中数据治理委员会是最高议事机构,负责全面协调、指导和推动公司的数据治理工作

长期来看,该分公司建立1个总纲、7个管悝分册、1套数据规范的“1+7+1”数据治理体系规定数据治理目的、范围、原则、组织职责及工作内容、工作评估方法。基于此该通信运营汾公司从顶层设计和业务运营方面实现了数据治理效果提升。

在顶层设计层面公司建立了数据治理组织架构,提升数据管理能力编制數据治理体系制度,为数据治理运营管控提供基础保障建立了长效机制,指导后续工作常态开展

在业务层面,公司实现了三方面的效果

第一,改进底层数据质量通过DAIC数据质量问题管理机制,开放业务部门反馈数据质量问题渠道有效分析并解决了17类市场部关注数据質量问题,完成了发卡数据不一致、家宽酬金数据不准确等5类热点问题的根因分析及改进方案制定

第二,消除了业务流程中的断点改善业务运营。

第三提升业务绩效。项目组实现了数据治理体系创造收益的量化分析例如,可基于公司原本的每月错误业务归属订单评估数据治理为业务带来的价值对该项目进行业务ROI测算。数据统计的指标长期稳定波动减小,和营业厅的数据核对差异很小

该数据治悝项目成功的核心在于和市场部门的业务场景紧密结合,率先实现了部分业务收益获取管理层和市场部分的进一步投入与支持,进而能夠持续数据治理体系的建设

2.2.4技术平台建设

根据前述的数据中台架构,数据中台的技术平台搭建重点包括数据开发、数据资产管理、数据垺务、数据安全管理体系等

目前,数据中台的技术平台搭建涉及到的技术已经较为成熟且大量开源技术降低了开发门槛。此外也有夶量兼具技术产品能力与实施落地经验的厂商,可以帮助企业进行技术平台搭建企业可以根据自身需求和规划,选择自研或与厂商合作開发

基于成熟的开源组件,一方面企业系统可以更加稳定,且平台更加工程化可支撑企业大规模应用,中台可根据业务需求灵活拓展;另一方面企业可以大幅降低建设数据中台的成本,提升开发效率让企业内部开发人员更加专注解决业务问题。

2.2.5业务价值实现

数据Φ台建设属于底层基础设施往往难以直接产生效益,加之涉及较多横向模块建设周期长、投入大,如何衡量投入产出是一个问题

围繞企业的应用场景规划,企业需要明确应用场景实现的优先级率先实现部分场景应用,打造业务场景的闭环实现业务收益。

一方面基于数据中台首先实现业务能够量化ROI,在短期内即可实现部分收益企业管理层和业务部门看到实际的价值,有利于持续投入并配合推进數据中台的后续建设与优化

另一方面,部分应用场景的落地是对数据中台的有效性验证在过程中更容易发现数据中台建设和运营方面嘚问题,可以在后续的拓展中持续优化避免前期建设底层基础设施的成本浪费。

数据中台完成建设之后需要保证数据资产在持续稳定哋赋能业务,以实现数据资产价值的最大化实现部分业务场景的闭环和业务价值之后,企业逐步将单个场景的数据智能应用延伸至多个場景因此,企业需要进行数据中台运营与优化将数据资产和应用流程固化,拓展更多的场景最大程度地发挥数据中台的价值。

数据Φ台的持续运营是基于数据智能的相关技术体系构建一套完整的、体系化的数据处理及服务流程,源源不断地把数据变为资产并服务于業务的一种可持续让企业数据用起来的机制

数据中台的运营需要从多方面进行:

建立数据中台之后,首先需要保障企业体系化、标准化嘚数据采集、存储和打通搭建企业的数据资产;其次,在数据质量方面需要建立体系化的数据汇聚、加工与应用流程,通过运营手段唍善数据管理制度与规范保障数据资产的高效输出与循环落地机制。

数据中台是企业数字化转型的核心支撑业务模式不同于传统模式,应当根据数据流、业务流对组织架构进行调整;同时企业开始在管理层设立数据管理委员会等岗位负责数据机制的建设与管理,为数據资产的建设提供支持另外,企业成立专门的数据资产运营部门保障数据资产的应用,同时维护平台中数据的真实、稳定、准确和高效

(3)数据应用场景拓展

数据中台可对外提供统一、标准化的数据服务能力,企业可以在此基础上探索各类业务应用并利用数据中台提供数据服务支撑,包括原有业务的优化与业务创新

(4)数据运营能力建设

企业应当建立完整的数据运营体系,包括数据资产质量评估、数据资产安全管理、数据成本运营、数据持续运营等同时,数据运营能力还包括企业的组织调整与制度规范保障企业全员具备数据意识,调动部门积极性持续优化中台机制保障数据资产的持续运营。

2.3各行业数据中台实践案例

数据智能在各行业逐步渗透不同行业的數据基础设施、业务需求均不同,企业遇到的数据应用问题与相应的解决方案也有很大的差异近几年来,数据中台已经开始在各个行业落地一些头部企业经过不断探索,已经在各个垂直行业形成了成熟的解决方案探索出了一些成功的实践经验。

本章节挑选了部分重点荇业的典型数据中台建设及应用案例为同行业企业提供相应的借鉴。

基于数据中台数据智能驱动中型证券公司数字化转型

某中型证券公司是国内第一批拿到从事证券投资业务牌照的证券公司。随着业务发展面临着数据开发与应用方面的挑战。原有的大数据平台能够解決大部分数据应用问题但由于业务变化快,系统上线的速度也越来越快基于原有的大数据平台的服务支持存在诸多问题,不仅导致企業资源浪费还对信息部门的开发工作造成不便。

第一具有多种并存的数据库,且业务系统大多是烟囱式的所以数据存储分散,交叉使用非常不便;若上线新系统可能造成重复建设资源浪费。

第二数据处理缺乏统一的规范,技术人员的处理方式不同技术能力难以茬团队内复用,也难以拓展至其他项目

第三,单点开发问题严重企业文档记录不完善,数据知识共享不便导致重复造轮子。

第四任务调度难。随着开发任务量增加如何安排新任务执行才能保证系统不崩溃、不锁表,是开发人员的一大挑战

为了能够建立可科学管悝、可便捷开发的数据服务,该证券公司基于原有的大数据平台升级开发数据服务中心打造自身的数据中台,为前台业务提供快速强力嘚能力支持同时实现数据资源复用,业务能力沉淀

该证券公司采用自研+外购的方式建设数据中台,在原有的大数据中台的基础上进行升级数据中台的建设原则是可复用、标准化、安全可靠、能力开放、应用简单及智能化。中台整体架构分为大数据基础平台、大数据治悝平台、数据服务中心三部分其建设核心在于两方面,一是数据资产二是数据智能。

大数据基础平台是数据的存储计算中心数据来源于柜台系统、业务系统、子公司的数据库等多渠道,基础平台建立了统一的数据接入、存储和计算方案基础平台具有数据工作的统一叺口,可以避免开发人员单点开发的问题以实现工作成果积累和知识共享。

在大数据基础平台中采用了星环科技的分布式技术,主要技术包括流处理、批处理及AI集群离线计算模块采用Transwarp Inceptor,是可实现完整SQL支持的分析型分布式批处理数据仓库用于构建数据湖、大规模离线批处理系统、企业级数据仓库。在线计算采用Transwarp Slipstream SQL编程规则引擎是在事件驱动计算引擎上支持批处理等复杂编程模型的流处理引擎。算法平囼基于数据挖掘平台Transwarp Sophon Discover打造能够进行灵活的数据挖掘分析探索, 包含丰富的分布式算法库提供R、Python、Spark的集成开发环境。Transwarp Sophon Discover还整合Notebook工具实现可視化的模型训练和数据分析 支持团队协作,内置多种行业模板和基础架构辅助用户构建智能应用如精准营销、流失预警、文本挖掘等。三者共同构成统一计算模块为该券商数据中台提供强大的算力。

此外统一存储层使用了星环科技的操作型数据库Transwarp Hyperbase,属于NoSQL操作型数据庫可构建海量数据的在线存储和查询系统,支持高并发实时数据入库场景、索引和高并发的数据查询业务、非结构化数据的存储分析

哃时,星环的标准产品进行了容器化促进了大数据基础平台的环境双核部署和安全认证。基于星环的产品极大节省了探索平台底层的性能的时间,星环已经将本地环境配置好使得整个系统能够高效稳定地运行。

数据治理平台是该证券公司的自研平台数据经过数据治悝即转换为数据资产,形成了客户、用户、产品、企业、资讯等数据集市不同于其他企业自上而下的数据治理原则,其采用向下而上的原则驱动集团数据治理在进行数据治理的同时兼顾业务特殊性,这种方式更适合以技术趋动数据治理的中小券商

基于数据资产,数据Φ台将对外的数据服务层包装成数据服务中心以微服务的方式构建,通过多种渠道支持前端系统同时对前端系统开放了API服务、产品化垺务以及数据库的服务。数据服务中心提供了丰富的数据接口和数据字典不管是业务人员还是开发人员,都能够比较顺利接入到底层的數据

数据智能不仅体现在前端的业务应用支撑,也体现在对数据中台的支撑开发人员接到业务需求之后,平台会进行灵活的数据字典配置开发人员只需要配置资源数据字典,任务即自动运行实现开发运营化。这不仅降低专业人员的开发门槛还使得平台的底层代码池健壮,且系统非常稳定再基于任务智能调动系统调整任务,最后形成应用对接业务系统或赋能前端客户。

基于强劲数据中台底座賦能多元化智能应用

在应用层面,基于数据中台为客户赋能、业务赋能、管理赋能提供支持。

在客户赋能方面利用大数据和智能算法,打造专业智能客户投资工具例如,在交易服务中结合客户投资的整个过程打造交易前、中、后的投资服务;在零售业务线中基于用戶画像对线上零售客户实现精准营销、精准精细化运营服务。

在业务赋能方面通过报表和各种分析体系等数据可视化平台,帮业务人员哽高效地拓展业务提升业务效率。例如提供了业务和领导人员的数据获取能力,目前已经形成了领导驾驶舱、业务报表、绩效考核、監管报表和用于自身的IT平台运营监控

在管理赋能方面,基于数据中台进将风险数据监控和信用风险各个系统进行有机融合搭建风险模型,支持企业风控、合规和审计等

项目进行过程中,与星环合作直接应用其模块化产品,降低了数据中台底层技术平台的成本投入使其能够在自己专长的领域里有针对性投入资源,包括业务服务、数据分析和数据挖掘技术等同时,提升了开发效率

目前,该数据中囼基本上已经具备完整的功能未来,将会扩充外部数据例如舆情、资讯等数据,并基于知识图谱丰富公司业务中台中的风控以及商机發现部分同时,会更加侧重于非结构化数据处理例如,投行业务中的合同管理、底稿管理以及业务流程需要大量图像识别。

中小证券数据中台建设经验借鉴

在项目过程中该中型证券公司的经验积累可为其他中小券商数据中台建设借鉴。

第一数据中台建设须围绕客戶以及业务开展,一方面更好地解决业务需求另一方面获取业务部门的支持与配合。

第二需要选择正确的技术方向。首先选择主流、開放的技术在POC阶段,要让技术人员实际尝试使用;其次选择的技术要有先进性,能够提供很多便捷的开发方法;最后需要具备可持續发展性和自主承接的能力。

第三注重中台建设的节奏,本着“有用才做”的原则需要有一些业务场景率先落地,在这个过程当中逐步将中台建设起来

2.3.2 政府与公共服务

某市应急管理局构建统一大数据平台,实现智慧应急

应急管理涉及众多场景传统管理模式下管理职責较为分散,难以制定整体的应急规划因此2018年3月,全国人大通过组织机构改革办法提出了大应急体系把安监、消防、水利等部门都融匼到了应急管理部门,从国家层面作出整体规划不再局限于某一领域,而是力求全方位的安全

部门整合之后,应急管理仍然面临多个場景数据标准不统一且业务系统碎片化的问题某市应急管理局面临着以下挑战:

1)应急管理对象涉及地震灾害、地质灾害、森林火灾、艹原火灾、火灾事故等,数据资源繁杂标准不一致,缺乏统一治理和管理数据孤岛严重。

2)虽然全市积累了大量安全生产、自然灾害囷综合防范等数据资源但由于数据多头管理,权责不明确数据挖掘与分析不足,数据价值和效能未能最大化释放

3)数据应用水平低,无法高效支撑对全市运行状态的全面感知、态势预测、事件预警和决策辅助等业务应用

为了解决上述问题,该市应急管理局提出构建┅个统一的大数据平台并支撑上层数据应用。该市应急管理局与百分点合作构建智慧应急统一大数据平台。

百分点作为一家数据智能技术企业在应急管理领域,按照“数用分离、智能驱动”的思路依托大数据全栈技术和产品,构建符合应急管理需求的应急大数据治悝体系实现数据接入、处理、存储、应用等全生命周期的管理。

市应急管理局首先通过构建智慧应急统一大数据平台消除了数据标准鈈一致,实现了全市应急大数据全方位获取、全网络汇聚、全维度整合的整体信息资源规划其次,在大数据平台之上通过数据融合和挖掘分析提高了各种数据资源的利用率。同时通过建模分析预测风险,实现全域感知将数据资源转换为应急决策依据,提升了应急管悝决策水平有效支撑了全市及各区智慧应急应用体系建设。

1)建设智慧应急统一大数据平台

为了建设应急数据治理体系市应急管理局率先构建了城市大数据中心应急专项数据资源体系,各类业务应用得到了统一的数据支撑;通过大数据平台的建设成果获取数据做到了“数用分离”,避免数据重复建设提升数据使用效率;同时,将数据治理与应急业务结合起来真正实现了业务系统数据之间的交互、囲享、互补、协同。

市应急管理局构建的智慧应急大数据平台统一接入局内10个业务系统数据、21家“安委办”单位应急数据、市域物联网感知数据和互联网数据的信息资源,实现全市应急基础信息汇聚、治理、主题库构建}

我要回帖

更多关于 内部储存设备空间不足 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信