你认为数据治理的关键能力是什么中国系统是如何提供数据治理方案的

重点的话从技术实施角度看,主要包含“理”“采”“存”“管”“用”这五个即业务和数据资源梳理、数据采集清洗、数据库设计和存储、数据管理、数据使用。

數据资源梳理:数据治理的第一个步骤是从业务的视角厘清组织的数据资源环境和数据资源清单包含组织机构、业务事项、信息系统,鉯及以数据库、网页、文件和 API 接口形式存在的数据项资源本步骤的输出物为分门别类的数据资源清单。

数据采集清洗:通过可视化的 ETL 工具(例如阿里的 DataXPentaho Data Integration)将数据从来源端经过抽取 (extract)、转换 (transform)、加载 (load) 至目的端的过程,目的是将散落和零乱的数据集中存储起来

基础库主题库建設:一般情况下,可以将数据分为基础数据、业务主题数据和分析数据基础数据一般指的是核心实体数据,或称主数据例如智慧城市Φ的人口、法人、地理信息、信用、电子证照等数据。主题数据一般指的是某个业务主题数据例如市场监督管理局的食品监管、质量监督检查、企业综合监管等数据。而分析数据指的是基于业务主题数据综合分析而得的分析结果数据例如市场监督管理局的企业综合评价、产业区域分布、高危企业分布等。那么基础库和主题库的建设就是在对业务理解的基础上基于易存储、易管理、易使用的原则抽像数據存储结构,说白了就是基于一定的原则设计数据库表结构,然后再根据数据资源清单设计数据采集清洗流程将整洁干净的数据存储箌数据库或数据仓库中。

元数据管理:元数据管理是对基础库和主题库中的数据项属性的管理同时,将数据项的业务含义与数据项进行叻关联便于业务人员也能够理解数据库中的数据字段含义,并且元数据是后面提到的自动化数据共享、数据交换和商业智能(BI)的基礎。需要注意的是元数据管理一般是对基础库和主题库中(即核心数据资产)的数据项属性的管理,而数据资源清单是对各类数据来源嘚数据项的管理

血缘追踪:数据被业务场景使用时,发现数据错误数据治理团队需要快速定位数据来源,修复数据错误那么数据治悝团队需要知道业务团队的数据来自于哪个核心库,核心库的数据又来自于哪个数据源头我们的实践是在元数据和数据资源清单之间建竝关联关系,且业务团队使用的数据项由元数据组合配置而来这样,就建立了数据使用场景与数据源头之间的血缘关系 数据资源目录:数据资源目录一般应用于数据共享的场景,例如政府部门之间的数据共享数据资源目录是基于业务场景和行业规范而创建,同时依托於元数据和基础库主题而实现自动化的数据申请和使用

质量管理:数据价值的成功发掘必须依托于高质量的数据,唯有准确、完整、一致的数据才有使用价值因此,需要从多维度来分析数据的质量例如:偏移量、非空检查、值域检查、规范性检查、重复性检查、关联關系检查、离群值检查、波动检查等等。需要注意的是优秀的数据质量模型的设计必须依赖于对业务的深刻理解,在技术上也推荐使用夶数据相关技术来保障检测性能和降低对业务系统的性能影响例如

商业智能(BI):数据治理的目的是使用,对于一个大型的数据仓库来說数据使用的场景和需求是多变的,那么可以使用 BI 类的产品快速获取需要的数据并分析形成报表,像派可数据就属于专业的BI厂商

数據共享交换:数据共享包括组织内部和组织之间的数据共享,共享方式也分为库表、文件和 API 接口三种共享方式库表共享比较直接粗暴,攵件共享方式通过 ETL 工具做一个反向的数据交换也就可以实现我们比较推荐的是 API 接口共享方式,在这种方式下能够让中心数据仓库保留數据所有权,把数据使用权通过 API 接口的形式进行了转移API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等

}

【摘要】随着时代的进步大数據和高级分析的时代已经到来,我们可以说这是一个大数据“掘金”时代本文提炼出九个洞见,帮助领导者提升企业基于数据事实解决問题的能力为了企业可以解决问题,这九个洞察你务必理解透小编希望今天的文章可以给你帮助。

全球每天都有数十亿部手机、传感器、支付系统和相机等设备催生出指数级增长的数据量可以说,大数据和高级分析的时代已经到来错失高级分析带来的代价颇高。最囿远见且敏捷的企业竞争优势最大而落后的企业将会逐渐衰落。

数据分析不应仅仅是企业首席信息官(CIO)的职责虽然,CIO的专业知识非常丰富但其对全盘业务缺乏充分理解会导致错失重大机会,也缺乏推动公司进行高级分析变革的权力因此,高级分析工作一定要由首席执荇官(CEO)和业务部门领导共同参与指导才能加快企业内部变革步伐,同时保证投资决定的科学性麦肯锡研究发现,这种模式已经逐渐形成瑺态:超过一半的CEO认为自己在牵头管理企业的高级分析工作而且这一比例还在稳步增长。

麦肯锡就高管领导高级分析的现状访问了300多名优秀企业的高管本文提炼出九个深刻洞见,帮助管理者推动企业高级分析的变革工作

01、厘清高级分析背后的逻辑化

高级分析的崛起会颠覆许多行业的主流商业模式,对于CEO来说当务之急是厘清背后的逻辑。

这一洞见有两方面值得企业深思:第一在解读高级分析能力的潜仂和长期趋势之前,企业应充分理解其将如何颠覆现有商业模式?可以从领先行业学到哪些先进经验?如何通过迭代商业模式更好满足客户需求?第二,以数据为切入点开始抓住新机会分析数据价值、了解数据的不同之处、洞察其价值、学会与其他资源结合实现增值。然后企业方可认真思考其商业模式。一个简单的入门方法是对市场上的数据分析类公司和同业深入考察了解其动向,由此诊断企业当前的市場定位和竞争方式并在生态系统中找准长期方向。

02、明确高级分析应用的领域

只有通过在实际业务问题中运用大数据分析和高级算法设計出优化的解决方案高级分析才能真正为企业创造价值。

然而不少企业都是浅尝辄止,缺乏通盘考虑而能真正思考如何将分析能力變现的企业更是少之又少。在缺少全局视野的情况下企业领导人很难制定出可靠的商业方案,同时也难以传达高级分析能力的重要意义而这恰恰是驱动企业下决心开展高级分析变革的关键。对这种情况的建议是:与高管团队明确高级分析能带来最有前景的价值来源首先,企业要确定价值链中最具潜力的部分例如对于消费品公司来说可能是产品开发或库存优化;对于保险公司来说可能是风险模型。然后根据公司规模提出相应数量的可行使用案例大公司可能达到上百个,小公司可适当减少并分析数据和技术能力可以扮演怎样的角色。對每个使用案例进行外部对标以衡量其价值最后按照使用案例的经济效益、适配性、可行性和实现速度等条件进行优先排序。

大多数公司尚未将实时数据纳入日常业务流程部分公司还没有确定自身真正所需的数据。企业还面临着如何统一标准实现数据集互通(例如交易数據和客户档案)、提高数据质量和数据可用性等常见挑战

对这一点的建议是:数据是一片汪洋大海,同时还在呈现指数级增长为避免翻船,企业高管必须将数据战略与分析战略相结合在探索新数据源时高管要牢记从特定使用案例出发,并思考数据的来源是商业供应商还是開源对业务数据的熟悉度是企业实现数据变现的第一步。企业要不断提高数据质量落实企业治理和商业流程,确保所有获得授权用户嘚直接访问数据的权限鼓励优秀的数据和元数据实践,自动构建数据协调过程不断验证新数据是否符合质量标准。企业可以选择在集Φ式存储库(又称“数据湖”)中实现不同数据集互联同时企业要化繁为简,避免为所有历史数据构建数据湖这样耗时数年的行为麦肯锡建议企业应从优先使用案例所需的数据开始,再逐步添加其他数据数据构建始于已有数据,避免过度追求完美而作茧自缚

04、数据所有權和访问权需要民主化

企业拒绝采用与直觉相违背的高级分析洞见的最常见理由是基础数据无效。避免这一问题的前提是由业务部门负责數据质量同时授权业务负责人随时访问数据。具备卓越分析能力的企业会尽可能提供数据访问权限同时确保内部统一“单一事实来源”的定义,帮助员工共同使用数据群策群力,与时俱进某大型制药公司的CIO对麦肯锡表示:“向公司全员公开数据,是消除业务部门和科技部门之间互相推诿职责的关键”这种做法有利于在企业中贯彻数据驱动的决策思维。对这一点的建议是:企业应设计有效的数据治理方案落实权责,指定负责数据定义、创建、校对、管理和验证的牵头部门如业务、科技和分析中心等。同时对数据采取“业务主责通鼡访问”的双重原则。即使储存和支持数据的是科技部门业务部门也应当对数据负主要责任。企业还可以创建数据利用平台便于前线員工轻松自助提取数据的服务门户,同时举办数据利用教程提升全员对数据分析的认知水平。

05、变革管理和数据科学同样重要

企业内传統的工作方式素来根深蒂固包括对分析工作的潜在不信任。高管们亟待解决的一个关键问题是如何说服一线员工利用高级分析获得的洞见改变其决策方式。通用电气前CEO杰夫·伊梅尔特对麦肯锡表示:“一开始我以为增加几千名技术人员,再升级软件就可以解决这个问题事实证明我错了,产品经理、销售人员和一线支持人员必须一起改变”对这一点的建议是:只有当员工理解改革,并把自己看作是改革仂量的一部分时他们才真正接受改变。因此在设计高级分析解决方案时要以用户为本,在最初环节就要引入业务部门的参与最好搭配一位既懂数据科学,又理解如何落实于业务应用的“翻译”全程主导使用案例开发。企业要做到人尽其才:业务人员识别机遇数据科學家开发算法,用户体验设计师塑造交互界面软件开发人员专注开发原型,流程工程师实施修正工作流程变革小组执行落地。企业要為每个使用案例设计一套战术手册抓好培训和沟通。除了单个使用案例之外企业还要设计一份宏观层面的改革方案,培养高级分析能仂驱动企业范围内的整体数字化转型。

06、关注学习指标然后衡量

某大型保险公司高管曾提出一系列问题:“如何确保我们在分析方面的投资是值得的?衡量的指标是什么?如何量化分析能力创造了多少价值?怎么判断分析能力对团队进步的贡献?”这些问题十分常见,但在麦肯锡嘚访谈中却很少有人能够解答如果缺乏明确衡量高级分析能力价值的指标,又无法保障内部顺畅沟通企业很难为其对分析能力的投资提供有力支持和佐证。而由于分析能力通常应用在支持决策制定很难与其他计划分隔来看,所以对分析能力的量化评判更难实现对这┅点的建议是:企业可以建立包含所有关键业绩指标的绩效仪表盘,并关联数据库实现自动更新轻松掌握实时动态。在此基础上企业必须相信数据。某投行的CEO表示:“通过参考统计信息而不是光凭直觉,我们得以利用数据的指示在正确的时间做正确的事。学会摒除情緒影响和对当前焦点的干扰是成功的必经之路”自动化和数字化帮助企业实现实时查看业务数据,必要时改变业务策略而不是等一个朤、一季度或者一年结束再回头分析。衡量业绩的指标更新频率得到了提升对企业来说其价值斐然。高级分析的价值产生在正在运用数據分析的企业因此企业领袖应该决策开展高级分析的进度节奏,并严格执行

07、诸四海而皆准的流程化

高级分析的最佳运营模式是什么樣的?核心问题在于集中化负责数据分析的卓越中心(COE)和业务部门应如何分配职责。事实上只要使用得当,每一种模式都可以成功对这一點的建议是:企业领袖应评估高级分析的决策权位置:到底是在总部还是在业务部门,基于此设计一个充分利用现有结构优势的分析组织模型对于已经存在的卓越中心(COE)则需要评估其效用,包括:决策速度有多快?分析解决方案有否足够的业务投入?这些解决方案是否捕获了预期价值?

08、关注数据科学家和“转译人员”

高级分析人才市场依旧紧张大多数接受采访的CEO均表示自己的企业已经雇用了数据科学家,反而现在更需要的是精通分析的商业老师也就是我们提到的那些能发现机遇、构建问题、制定解决方案并掌控变革的“转译人员”。某CEO表示:“要找個会做生意的业务人员或者通晓技术的软件工程师不难真正紧缺的是那些既懂业务又会技术的人才。”可见这一问题的关键是要找到能夠理解和处理数据并能将数据转化为价值的人才。对这一点的建议是:找准一批有统计学、计量经济学等数理背景的优秀人才然后设计囿针对性的培训项目来强化他们的分析能力。培训课程不应局限于数据科学还应包括领导力和管理技能用来领导端到端的使用案例识别囷实施,同时引领文化变革课程设计要结合在职培训、面对面授课和在线复习等授课方法,并授予毕业认证通过这类举措,企业可以形成统一的内部沟通方式和标准

09、实现重大创新的捷径

企业总是报喜不报忧,成功时总是大张旗鼓遇到困难就习惯遮遮掩掩。与此同時许多初创公司和敏捷型企业则遵循数据驱动、测试和学习相结合的文化准则。公司高层在明确愿景之后乐于鼓励员工探索新机会,赽速完成概念证明然后用数据说话。这一过程的关键在于迅速产生非直觉的新观点测试后进行决策取舍。此时企业可以尽快坦然地公布失败信息,并从中汲取利于再次迭代的经验 对这一点的建议是:企业可以采用沙盒模式。顾名思义这种模式的可塑性很强,用户可鉯快速进行拆建沙盒模式可以提供有效发现新功能、运行相关性测试并执行分析的工具、技术和计算机能力。当出现新的信息和需求时企业也可以快速拆除旧框架,无需再走一遍冗长的数据安全性、合规性和清理流程

要打造一种基于数据事实解决问题、员工乐于拥抱變革的企业文化,上述要点必不可少同时企业要习惯接受并能坦然应对日常运作中不可避免的负面消息。企业在设定投资标准时应该接受大部分实验将失败这一事实,同时明白每实现一个里程碑式的目标就意味着投资规模的增加铭记速度就是一切。

综上就是你务必理解透的这九个洞察大数据“掘金”时代,全面转型要求企业全体业务部门围绕共同的战略愿景进行变革打造基本功和转型动力。这一過程通常需要两到三年的时间因此,企业采取行动的时间窗口已经十分紧迫这是一个不进则退的境地,落后的企业很难翻盘正如某CEO說的,“现在已经不是大鱼吃小鱼的时代而是快鱼吃慢鱼的时代。”

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信