中国版Tableau数据分析用什么软件做工具永洪Desktop怎么样

大家都回答的是工具产品似乎嘟没有人讲讲R语言和Python,怒答

ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念当熟悉了ggplot2的基本套路后,数据可视化工莋将变得非常轻松而有条理

1. 将数据,数据相关绘图数据无关绘图分离

这点可以说是ggplot2最为吸引人的一点。众所周知数据可视化就是将峩们从数据中探索的信息与图形要素对应起来的过程。

ggplot2将数据数据到图形要素的映射,以及和数据无关的图形要素绘制分离有点类似java嘚MVC框架思想。这让ggplot2的使用者能清楚分明的感受到一张数据分析用什么软件做图真正的组成部分有针对性的进行开发,调整

2. 图层式的开發逻辑

在ggplot2中,图形的绘制是一个个图层添加上去的举个例子来说,我们首先决定探索一下身高与体重之间的关系;然后画了一个简单的散点图;然后决定最好区分性别图中点的色彩对应于不同的性别;然后决定最好区分地区,拆成东中西三幅小图;最后决定加入回归直線直观地看出趋势。这是一个层层推进的结构过程在每一个推进中,都有额外的信息被加入进来在使用ggplot2的过程中,上述的每一步都昰一个图层并能够叠加到上一步并可视化展示出来。

3. 各种图形要素的自由组合

由于ggplot2的图层式开发逻辑我们可以自由组合各种图形要素,充分自由发挥想象力

这一步需要设定的是图的x轴y轴和”美学特征”。基本形式如下:

这一步里设置x轴和设置y轴很好理解。那么”美學特征”又是什么呢

举个例子来说,下面这张散点图里x轴表示年龄,y轴表示身高很好理解:

但这张图除了展示年龄和身高的关系,還展示出每个样本点的体重:颜色越深表示体重越大因此体重信息和年龄身高一样,也需要绑定到一个具体的列这一列就是散点图中嘚”美学特征”。

来看看R语言绘制代码:

其中的colour参数就是该图的”美学特征”

再比如,下面这张柱状图中x轴表示日期,y轴表示权重佷好理解:

但这张图中每个日期对应了两个不同的权重并采用两个柱状来对比,那么这个划分依据也是另一个“美学特征”

其中的fill参数僦是该图的”美学特征”。

综上所述图中的每个样本点除了通过它的坐标位置,还可以以其他形式展示信息比如大小,色深分组等。而这些新形式需要绑定的列便叫做”美学特征”。

“美学特征”的形式和xy轴一样是以列的形式给出,且列中元素个数和xy轴列必然楿等。它的设置也和xy轴一样在ggplot()函数的aes参数括号内进行。

上一步的主要工作是为数据可视化配置好了数据接下来便可根据业务的需要来繪制不同的图,如折线图/柱状图/散点图等等具体的实现方法在后面的章节中会细致讲解,这里重点提一下绘图函数里的stat参数这个参数昰对冲突样本点做统计,该参数默认为identity表示保留样本点原(y)值,还可以是sum表示对出现在这点的(y)值进行求和等等。

3. 调整数据相关图形元素 – scale系列函数、某些专有函数

在ggplot2中scale标尺机制专门负责完成数据到图像元素的映射。也许你会问”美学特征”不是已经定义好了这个映射嗎?然而事实是”美学特征”只是选定了映射前的数据并没有说明具体映射到什么图形元素。

举个例子假如某张表记录了不同种类水池的长,宽深信息。现在需要绘制不同种类下水池长和宽关系的柱状图那么初始化完成的是这个映射:

而scale函数完成的是这个映射:

显嘫a映射为了红色,b映射为了蓝色

也许你还会问,我的代码不用scale那么映射是如何完成的呢?答曰系统有默认映射的就像绘图函数都有默认参数stat=identity这样。

4. 调整数据无关图形元素 – theme()、某些专有函数

这部分包括设置图片标题格式文字字体这类和数据本身无关的图像元素。只需調用theme()函数或者某些专有函数(如annovate函数可为图片添加注释)便可实现

一个图层绘制好后便可观察调整,然后开始下一个图层的制作直到整幅圖绘制完毕。

Python不是很在行先放一放

FineBI是为大数据量提供数据处理、ETL、Dashboard报表展示、动态分析、报表管理的可视化分析工具。

举例FineBI操作摘自:

一、数据分析用什么软件做的操作思路

数据分析用什么软件做通常是这样切入的,比方说业务上发生了变化流量下降20%,那么我们就要汾析可能的原因需要多方数据去验证假设。又或者拿到一份数据思考可以分析的规律点。无论哪种情况一个完整的数据分析用什么軟件做都需要经历数据获取、数据预处理、数据分析用什么软件做与建模、可视化分析及报告撰写的过程。

FineBI这个BI工具的功能模块也是依据汾析的流程来设计的分为数据连接、数据准备、可视化分析、仪表板驾驶舱、分享仪表板等。

二、认识这个工具——FineBI的工作区

官网安装恏合适的版本成功激活,设置初始账号密码后会跳转到这个web页面。

左侧是导航栏类似于菜单栏。目录类似首页展现已完成的分析報告,这里默认展现官方的内置demo

数据准备是连接数据、准备数据,以及对数据进行再加工处理的地方可进行业务包、数据表、关联、哆路径、数据更新、自助数据集等管理。

仪表板即创建可视化分析管理系统即对整个数据决策系统进行管理的地方,包括目录的设置、外观设置、数据、报表、分享权限等管理配置

创建是提供给用户快捷新建数据连接、添加数据库表、添加SQL数据集、添加EXCEL数据集、添加自助数据集、新建仪表板的地方。

制作数据报告第一步是导入数据,FineBI能从很多种数据源导入数据:如ExcelCSV,XML以及各类数据库(SQL Server,OracleMy SQL等),两大主流开源平台(HadoopSpark)等等。最常用的方式是连接数据库和导入excel数据两种方式因为最常用,所以这里都演示操作一遍

1、数据库连接举例:连接mysql

同样的数据,用一份excel导入

第一步:数据准备—添加业务包,业务包是用来统一整理数据表的这里创建一个台风数据包。点击添加表新建excel数据集。

就得到如下的数据明细这里可以自动识别数据的字段类型,也可以修改字段类型(举例:有些情况下将时间识别成文夲类型,需要手动切换成时间类型不然会影响后续操作)

至此,数据就导入成功

四、数据塑性—自助数据集

自助数据集其实是数据加笁的环节。一般我们拿到的数据往往是有空缺值有重复所谓脏数据,脏数据需要清理关于数据清洗的处理可以写5000字篇,这里就不多讲叻更常见的情况是分析中需要新建一些字段,这是源数据所没有的这时候就可以根据需求对原数据进行再加工处理,新建一个用于分析的数据集再处理的操作包括:选择字段、过滤、分组汇总、新增列、字段设置、排序、左右合并、上下合并、挖掘。

这里因为分析的仳较简单且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作且一些过滤操作可以放到后面创建分析图表的过程中去莋。

其实在自助数据集之前,有个功能没讲到FineBI有个管理员的说法,这在企业部署中会涉及管理员可以给不用人分配不同权限下的数據,比如财务的只能看财务和销售的数据或者一部分财务人员只能看到特定的业务包里的数据,或者部分数据表这些都是出于数据安铨以及流程管理考虑。在管理员准备好数据后就可以分配给不同人员账号,以及部分权限的数据如果是个人使用,比如本文所要介绍嘚分析BI系统是部署在自己本地的,那自己就是管理员拥有最高权限。本文的分析暂时不需要用到权限功能这里只做简单介绍。

到这裏数据准备好了接下来开始正式分析。

先来观察这份数据这份数据是我从网上当下来的,展示了1945年——2015年登陆我国的台风信息包括時间、登陆省市以及台风强度。

那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些一年中哪个时间段是台风频发日,以忣台风强度分布

1、 新建仪表板,即我们说的可视化报告、dashboard叫法很多。

2、 新建可视化组件添加刚刚导入的数据集。(图表、查询筛选框等都叫组件是finebi仪表板的组成元素。)

分析1:各年度登陆我国的台风数量

添加完数据集会进入到这个分析界面拖拽要分析的字段(记錄数—统计台风数量的指标,登陆时间——这里只展示年份这个维度)

这里要注意源数据表中一个台风有多行记录,那是因为台风可能哃时登陆两个区域记录了两条信息,所以记录数要依赖CMA编号统计(记录数右侧小三角下拉)以免重复。

其次这里又添加了一个统计烸年台风平均数的指标。

最后再对次图表稍加美化通常在图形属性和组件样式中:

① 修改线条颜色:图形属性—颜色

② 修改连线为平滑曲线,并且可调整有无标记点

③ 修改该组件标题:组件样式—标题可调整字体样式

能明显感觉到登陆我国的台风呈现一个2~4年的波动变化,且2000年以来直击我国的台风整体数量有略微下降。

分析2:台风登陆各省沿海城市分布—数据地图

这里演示一下数据地图的制作用地图矗观展现台风登陆我国沿海各省市的分布。

必须将维度创建成地图角色生成经纬度。

匹配好数据后生成省份(经度)、省份(纬度)字段这里要注意检查一些匹配是否正确,我就遇到把辽宁省匹配成宁夏的bug匹配有问题可以随时调整。

然后将字段分别拖至横轴和纵轴會自动生成一个填充地图。除此之外还有点地图、热力地图等这里就用填充地图举例。

填充地图顾名思义就是用区域的颜色区分数值夶小。这里将记录数拖拽到图形属性-颜色即可看到区分,(颜色可在下拉框中自行选取)再将记录数拖拽到标签,即可显示登陆该省市的台风数量

在组件样式——背景中,可以修改GIS地图样式如下:

注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配銫图表布局等都可在图形属性和组件样式中选择。选项非常多请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤排序等操莋,都可在横轴、纵轴的指标维度下拉框中找到

其他分析大同小异,篇幅有限以上只举了两个例子。

图表分析组件完成之后就是构建可视化报告(dashboard)了。

仪表盘样式中有预设的模板可以直接套用以下是笔者随便套用的一个模板,更具模板的风格后面调整了每个图表的样式和配色。好不好看全看个人审美了

}

数据分析用什么软件做工具非常哆总结下来可以有几类,每个类别会有两个拔尖的产品这里简单罗列一下。

数据分析用什么软件做语言:Python和R语言这两个是数据分析鼡什么软件做语言的两个代表,非技术和技术背景都可以学习非技术背景建议学习R语言。

BI分析工具:Power BI和Tableau数据分析用什么软件做和BI领域嘚两个领先工具,非技术背景上手很容易学精需要花足够的精力。

数据库:Mysql和SQL Server这两个数据库基本满足多数企业需求。

数据技术框架:Spark囷Hadoop真正的大数据会用到这两个,大企业必备

数据分析用什么软件做应用:ML机器学习和DL深度学习,自动化和人工智能方向值得深入学習。

当然不忘提一下PowerBI的前辈—数据分析用什么软件做应用最强者Excel,数据分析用什么软件做启蒙大多来自于它

}

目前国内市场上的报表 BI 工具琳琅滿目看起来也各有特点,这给选型工作带来了一些困扰本文就一些较活跃的报表 BI 产品进行点评,对于不太熟悉这些产品和技术的同学可作为参考资料。

这里选了十个产品分作四类:国内报表类,国内 BI 类国外 BI 类,国外开源报表类每类两三种产品,在分类内大体会按面市时间为序来点评需要强调的是,因为篇幅有限不可能把市场上所有产品都选入,这并不意味着其它产品不好看到结论部分时僦会理解。

这么分类是有意义的同类产品大体具有相似的特征。其中国内产品被分为报表和 BI 两类,并不是说这两种功能有矛盾事实仩,国内产品大都同时兼备两种功能分开的原因是因为这些产品初期发布时的功能侧重点不同,经过多年完善它们大都已经发展成了铨功能产品,但初期侧重点的不同仍然会影响到产品理念乃至产品特征

涉及产品和版本较多,可能局部会有错误疏漏敬请谅解,欢迎指正

报表工具可能是企业级通用软件中仅有的、国产软件能力远远超过国外软件的领域了。这大概是因为中国报表有着非常强烈的特色从而造就了一批适应产品,而国外缺乏这个土壤也就很难发展出这种能力了。

润乾报表功能全面涵盖报表、填报、BI 的各个方面,没囿大块功能的缺失 不过这也是国内大多数报表 BI 产品共同的特点。润乾报表最大特色是复杂报表的能力润乾公司最早提出了用于解决中國复杂报表的非线性报表模型,直到现在无论是功能还是性能,润乾报表在复杂报表方面仍然是业界最强者

润乾报表自 2018 版开始集成了獨立计算引擎。大多数报表工具是在报表中完成数据计算而报表的计算能力和效率都相对较弱,不仅会因为要写复杂的 SQL 或存储过程导致開发困难而且在数据量大或计算较复杂时还会带来性能和容量的问题,发生报表响应迟钝甚至内存溢出的现象润乾报表则可以将取数忣复杂关联运算等放到独立的计算引擎中,并提供了大数据量游标取数这样即提高了开发效率,还能提高运算性能和数据容量并真正支持了大数据报表。

润乾报表本来内核模型的计算能力就很强性能也是多年来的优势,新版中又增加了计算引擎在这方面又有了质的提升。

在计算引擎的支持下还能让报表与应用的耦合性降低。复杂报表的修改常常涉及数据源逻辑而有计算引擎时,这部分也可以在報表模板中完成不需要像常规情况时必须修改应用程序中准备数据源的代码或者后台存储过程,从而可以做到全面的热切换这是其它報表工具都无法提供的能力。

计算引擎中还集成了大量常见非关系数据源的接口如 mongodb,hdfs,sap,…;这使得润乾报表天然能支持非常丰富的数据源類型

润乾报表的 BI 界面中规中矩,拖拽、切片、钻取等都有提供但老实说也没什么特别的,风格只能说很朴素(就是不够炫)不过,茬提交方式上却有与众不同之处润乾报表的 BI 界面部分是开源的,这样不管是集成调用还是客户化的定制开发都会比较方便因为润乾报表的理念定位是被集成,润乾把用于交互操作的 BI 组件都做成可以集成到第三方应用的页面的样子而如果界面风格和操作方式需要再修改時,还进一步提供源代码业界其它厂商则一般是提供可独立运行的 BI 系统,整体界面都是自己一套风格基本没可能集成到其它应用的页媔中,有修改也大都需要厂商介入润乾虽然也有一个报表中心可以独立应用,不过功能细致程度一般和其它专业做 BI 的产品相比显得有點简陋,不过好在它是开源的用户可以进一步再开发。从这个意义上讲润乾报表的 BI 挺适合用于 BI 教学,朴素风格和开源代码都有利于程序员进一步美化和封装

说到 BI,润乾报表后台有个独特的 DQL 模型多维分析时多表关联一直是个麻烦事,业务用户很难理解 JOIN所以常常要技術人员事先建模,把 JOIN 拼进逻辑或物理宽表中;也有 BI 产品将 JOIN 关系暴露给业务用户但业务用户只能理解最简单的情况,稍复杂的关联需求基夲就没人会用了DQL 模型则可以让业务用户以可理解的方式在界面上拼出非常复杂的关联分析,包括自关联都可以处理得很好

润乾报表的 BI 夲身没有提供自己的 CUBE,而是使用数据库能执行灵活的关联查询,但大数据量时会受数据库性能的拖累润乾有另一款集算器产品可以充當高性能 CUBE,但并不属于润乾报表它可以为其它厂家的 BI 产品服务。本文不讨论这种专业 CUBE就不分析下去了。

润乾报表的用户是程序员界媔的易理解性就不是重点。让接口更丰富以适应更复杂的环境和让程序员容易上手这两方面本身有一定矛盾性。润乾的权衡点在前者所以会有设置参数较多的问题,上手相对不易但对于熟练的工程师也不是大问题。

帆软报表也是功能非常全的产品目前开发中遇到的各种关于数据展现方面的需求像复杂报表、填报、大屏、BI 等都有解决方案。当然这些功能点在国内商用软件来说差别不太大,这里也没必要做过多的介绍了

帆软报表一个特大的优势是对开发人员很友好,设计界面更加时尚初学者上手容易,操作方便内置丰富的样式風格,做出来的报表展示效果更好一些而其他工具可能就要多花费点时间设置下,特别适合初学者上手

图形样式是帆软非常值得称道嘚地方。目前大多数报表工具采用 echarts 统计图效果不错,但要调整的细节有点多(比如润乾就是)帆软统计图多数为自己开发,类型全效果好,采用向导化设置能够在较短时间内开发出非常美观的图形。

除了报表工具帆软还提供了完善的平台管理功能,甚至包括流程填报、审批等功能这样实际上可以作为一个系统使用,对于没有自己平台的用户来说是个不错的选择不过反过来如果客户要用自己的岼台,那么集成起来工作量就会比较麻烦帆软提供的接口相对来说少些,这会导致定制化工作还需要进一步依赖于厂家

对于一些特殊數据源,比如 json 数据、mongodb 等帆软提供不同的插件,插件采用向导化安装选择不同的插件安装就行,也非常方便

和润乾相比,性能大概算昰帆软的一个短板尤其是涉及数据量大、有较多公式计算单元格的报表,计算性能会较差;常见的多数据集关联报表帆软也采用在报表中计算的传统方式,数据量大时性能就会很差(不过这是所有报表计算的通病只有润乾这种用表外计算引擎才能解决)。不过报表的性能大多是数据源造成的报表工具的耗时占比并不大,就算慢一点也常常可以通过优化数据源解决,这方面有性能问题并不算重要

帆软报表提供了单独的 BI 工具 FineBI,功能也是全面完整包括用平台管理、ETL、数据整合、数据分析用什么软件做等。前台操作简单流畅、美观细致程度都相当不错能快速实现常见的多维分析操作。不过BI 核心功能各个厂商相差不大,也不必再细说

有些 BI 产品会自己做一个后台 CUBE,早期国外 BI 产品常常都这样好处在于可以获得优于传统关系数据库的性能(数据库常常是行存,不适合高速 OLAP 运算)但缺点是需要事先根據分析主题建模准备数据,难以在界面上再做更多复杂的关联运算灵活性受限(CUBE 的运算能力通常远远弱于关系数据库)。FineBI 也提供了这种 CUBE所以上述的好处和坏处都兼而有之。

FineBI 也可以直接针对数据库进行分析上述的好处和坏处就可以反着看了。不过即使数据库可以进行複杂的关联运算,但如何让业务人员描述关联关系一直是个老大难问题FineBI 在这方面和业界大多数 BI 产品并没太大区别,也需要业务人员去理解 JOIN在关系较复杂时(比如有七八个表且有一表同维关联或自关联时),业务人员就不大可能拖拽出合理的关联查询了结果还是需要技術人员先做 CUBE,灵活性就大打折扣了

国内还有一批从 BI 开始入手的厂商,而报表功能则是后来在竞争中后补上的这类产品通常是 BI 强而报表能力会相对弱一点。

Smartbi 的功能也非常完善报表、填报、BI 一应俱全。这也是国内产品的标配能力

与众不同的是,Smartbi 的报表设计采用真“Excel”架構也就是 Excel 插件方式开发报表,比类 Excel 设计器学习成本更低常用操作方式、函数使用等完全是 Excel 中的用法。设计统计图时能够做到真正的所見即所得不需要预览就能够看到统计图的展现结果,更适合做统计图的布局等不过因为用了 Excel,报表设计器通常只能在 windows 上运行另外对垺务器资源要求也较高,官方推荐的 JVM 至少要 16G 内存

Smartbi 服务器部署采用 java 的 web 应用方式,服务端对环境没有限制功能比较齐全,像复杂报表、数據录入、统计图展示都支持而且现在带了 Word 和 PPT 插件,开发出来的报告格式效果比较好

Smartbi 其实并不以报表能力擅长,复杂报表功能是后加上詓的所以显得有点“不搭”,对于特别复杂的报表格式处理能力不如前面两家产品比如一些跨行组间的运算。采用 Excel 插件方式会使功能會受限于 Excel

更重要的问题是在性能方面,这还是可能和 Excel 相关当报表格数较多、且带有动态样式控制时,比如动态背景色、前景色报表嘚渲染速度会急剧下降,甚至出现无法响应的情况而前两家报表工具基本没有这种事(帆软的性能问题出在运算而不是渲染上,润乾则嘟没有渲染慢是报表工具本身耗时大,优化数据源无济于事)

Smartbi 的长项是 BI 功能,它提供了自助分析平台可视化的操作建立数据关联模型,并且提供 ETL 工具加工数据成独立的数据模型提供了全方位的数据分析用什么软件做功能。在 C/S 端对 Excel 工具熟悉人员可直接在 Excel 中进行多维喥数据分析用什么软件做,WEB 端提供所见即所得的仪表盘设计丰富的图标交互。支持即席查询快速查询数据。支持多维度的数据分析用什么软件做操作简单,功能丰富适合业务人员操作

Smartbi 支持直接数据库分析查询可以在界面上拖拽生成较为复杂的 SQL,甚至包括一些多層嵌套的 SQL超出常规多维分析的计算范围,这能有效扩展业务人员的分析能力不过,关联描述也是用的常规办法需要操作人员理解 JOIN,茬关系较复杂时实际操作难度比较大结果大多数情况还是要用事先准备好的宽表。

Smartbi 还提供有高速缓存库用作 OLAP 的后台以支持大数据量的汾析。但这个部件本质上像个数据仓库了而目前这类能力在业界常常是独立于 BI 产品之外存在的(Smartbi 这个缓存库有 JDBC 接口,应该就能向第三方 BI 提供服务)如前所述,这种专业数据后台超出了本文话题范围这里就不展开细说了。

Smartbi 支持的数据库类型主要是有 JDBC 接口的数据库NoSQL 数据庫目前只支持 mongodb 和 Tinysoft 等少数几种,再特殊的就需要写 java 程序进行处理了工作量有点大。

Smartbi 的接口开放及可配置程度一般在做一些深层次客户化萣制时会有些困难,许多完善动作还需要厂家配合

永洪也是侧重于 BI 数据分析用什么软件做能力,中国式复杂报表处理能力一般提供了洎由格式报表设计界面,做一些报告或者偏分析类的复杂报表问题不大比如像同期比、比上期这些分析中带有的功能都支持,但是一些複杂的单元格扩展运算类的实现起来就比较困难和润乾帆软相比有一定的差距。

永洪的 BI 能力是强项可以用可视化的操作完成数据建模笁作,过程比较简单支持各类数据源,通过直观易用的界面在 WEB 端拖拽以整合数据源产品提供丰富多样的可视化数据图表组件,展现样式美观有多种内置的风格样式及多种的交互联动分析功能,简单拖拽就能完成自助数据分析用什么软件做操作不过,还是老话核心功能大家都差不多,差别主要是界面风格也就不必细说了。

永洪有自己的后台 CUBE同时也支持数据库直接分析,这一点和其它几家 BI 产品差別不大对于表间关联分析,也是和其它大多数产品类似最好由技术人员事先做好逻辑或物理宽表。如果由业务人员临时生成数据在複杂情况下就会较为吃力。

永洪的 CUBE 可以扩展成基于列存技术的高性能分布式数据集市但据说不能给第三方 BI 提供服务,不能算作通用数据倉库类产品

作为国产软件,永洪 BI 也支持数据填报功能可以将数据录入嵌入到流程中实现流程填报,支持流程节点的审批等功能

永洪 BI ┅般作为平台独立运行,和其他业务系统集成性一般

永洪 BI 有个与众不同的地方:它把一些 AI 算法也集成进来了,可以实现建模预测功能泹老实说,这种能力对于 BI 产品并没有多大实用价值因为建模是个很专业的事情,需要深厚的统计学功底而这是几乎所有 BI 用户都不具备嘚能力,只是集成一些算法并不会实质有用有 AI 技术是件好事,建议专门发布成一个独立的 AI 产品没必要裹在 BI 产品中。

亿信 BI 也不以报表功能见长作为国内商用工具,亿信 BI 能够实现常见的中国式报表它的设计器同样采用国内主流的类 Excel 模式,但比较独特的是采用了 B/S 架构在线設计器也就是工具的零安装。但是WEB 设计器并不好用,JS 本来执行速度慢浏览器占用系统资源也多,开发报表时操作的流畅性(如右键操作等)都会有较大问题所以实用性一般。针对国内一些跨行组运算类的复杂报表处理能力也比较弱。而且它的报表引擎有点特殊先分析报表格式定义,生成多个 OLAP 对象给 OLAP 引擎然后再将 OLAP 引擎计算后的多个结果返回给报表引擎生成报表最终结果,这个如果报表格式复杂、数据量大时计算效率有待验证

亿信的重点还是 BI 方面,提供了专门的工具豌豆 BI。面向终端用户的自助分析(即席分析)功能界面简潔,容易上手功能也涵盖了自助分析该有的所有功能,不过细节上报表类功能有些瑕疵比如支持的导出格式较少且复杂点的表格导出 07 蝂 Excel 也有问题、打印分页控制不太好等。

亿信也是直接基于数据库做分析提供图形化的界面设置表间关联并可以实施一些运算。但复杂情況下的关联分析一般也需要技术人员事先准备数据集这和其它 BI 产品没太大区别。

亿信也有个相当于数据仓库的单独大数据平台产品是基于 Hadoop 的,可以对接 BIHadoop 体系的东西应该也能支持第三方 BI,不过性能也好不到哪里去(纯靠大集群堆)还是那个话,此话题超出本文范围了不细说了。

另外与其他 BI 产品一样,亿信也提供完善的平台功能对于需要整套 BI 平台的用户来说还是挺方便的,部署即用和其它国内產品类似,亿信还增加了数据采集功能数据来源可以由用户在页面端进行补录。

产品的可扩展性也不错包括一些函数、控件、任务周期、前端 UI 等都支持自定义或客户资源化,集成接口提供的也比较全面不过更多是作为平台单独运行,和其他系统集成性一般

国外的 BI 产品,感觉更多是面向商务人员在桌面使用的所以它们都有强大的客户端部分。而国内的 BI 应用场景大多是企业应用的一个环节要集成到企业门户中,必须是 WEB 应用这方面差异导致国外 BI 产品对国内大多数企业级应用的适应性很差,可用性不强所以这里有点厚此薄彼,对国外产品就没再评述得很仔细了大体能了解特点即可。

QlikView 是比较典型的敏捷 BI 工具提供了 ETL 工具,可以对需要分析的数据提前做数据清洗操作

QlikView 上手比较容易,提供直观的交互式用户界面内置丰富的图形类型和模板。侧重数据分析用什么软件做建模简单、项目搭建快、周期短。

QlikView 应该是首家内存式 BI数据分析用什么软件做时可将数据全部加载到内存中,操作响应及时、速度快支持离线分析功能,一旦数据刷噺完成用户就可以随时随地的进行离线数据分析用什么软件做。

通过 ODBC 连接数据库支持 sqlsever、oracle、mysql 等主流数据库,支持 Excel 文件对一些特殊数据源支持不友好(如多维数据库、nosql 等数据库),可能需要后续产品改进

数据加载到内存中,当数据量大时对内存耗用比较大带来较大的硬件成本,内存不够时性能影响会非常大,而且目前只能部署在 windows 上在非 windows 项目中需要额外服务器,和其他业务系统集成不太方便只能通过 url 嵌入方式集成,提供接口很少很难做客户化的定制开发。

作为国外工具无法处理国内复杂报表需求,无法处理数据录入需求

Tableau 是國外非常流行的一款数据可视化软件,典型的敏捷 BI 工具适合各类人员在各个场景下使用,安装简单、操作方便对操作人员很友好,易於上手比 QlikView 要更简易。

内置丰富的图形类型和模板图形支持智能推荐,能协助制作人员选择合适的图形类型展示制作出来的效果美观喥相当高,交互性相当不错

和国内产品都采用 WEB 端操作方式不同,Tableau 还提供了桌面端的分析工具 _Tableau_ Desktop操作会更为流畅,比如一些快捷键等

支歭常见的各种数据源,并且支持多源关联这个在国外软件中相对比较少见。以前底层数据处理能力较差后来提供了单独工具 Tableau prep 对数据进荇加工清洗,业务较复杂时还需要第三方的数据处理工具或者数据仓库

作为一款典型的国外的 BI 工具,主要侧重于数据分析用什么软件做與数据可视化处理国内的复杂报表就无能为力了,这也是 Tableau 经常被抱怨的地方当然,和其它国外产品一样它也不支持数据填报的功能。

18 年推出了 linux 版的 Tableau这样产品可以在各种操作系统上运行,采用单独的安装文件作为独立的平台运行比较方便,但是无法和其他门户做无縫集成只能采用 url 调用方式,集成性比较差还需要考虑用户权限同步等。提供的接口较少如果有客户化的定制开发工作,比较难实现

其实 PowerBI 的发布时间很早,但在市场上一直不温不火直到近年才开始有点热闹,所以把它排到了 QlikView 和 Tableau 后面

相比于其他 BI 工具主要在 web 端操作,PowerBI 提供的是一个 C/S 的分析工具采用类 office 的界面模型,一些常规操作按照 office 中的设置就行能够完美的与微软其他产品无缝衔接。

作为一款数据可視化工具展现效果比较丰富,内置了多种效果库可以灵活选择,开发简单数据分析用什么软件做操作类似 Excel 的数据透视表,对 Excel 功能比較熟悉的人员可以说是零门槛

工具支持多种数据源类型,目前常见的基本都支持但提供的接口较少,特殊数据难以通过接口扩充

提供了多种工具组合,比如 C/S 端的 Power BI Desktop 用来设计设计好的结果发布到 Power BI Server,移动端的 app 进行查看等都需要单独安装。C/S 端设计结果可以直接在工具内部汾享其他人查看也可以上传到 Server 实现协同开发,协同开发能力较强不过如果和其他应用集成的话不太灵活,只能使用 url 嵌入访问权限不恏控制。并且作为微软下工具不利于跨系统部署。

同样是侧重于 BI 分析的工具不支持国内复杂报表制作,不支持国内的数据录入需求

國外也有从报表功能开始发展的产品,早期著名的有 crystal report后来被收购几轮以及 Java 的兴起后(crystal 不是 java 技术的)就不再常见了,现在还有些用户群的基本只剩开源产品了

开源报表产品无论在中国报表还是 BI 方面的表现都不好,这里同样没有必要做很详细的评述了

国外开源报表的代表,BIRT 开发使用了传统的控件式编辑方式而不是 Excel 网格式上手会比较困难,像做一些简单的颜色设置、数据对齐、布局等操作可能就会比较费倳国内复杂报表基本很难实现。

开源报表的优势是免费没有工具成本,接口也足够丰富不过开发工具要嵌入到 eclipse 中使用,对开发人员技术水平要求更高要专业开发人员才能够使用。

BIRT 没有提供 WEB 端的数据分析用什么软件做功能如果想做只能通过大量的二次开发工作,在頁面端通过参数传递方式实现一些维度的替换难度很高。

对于一些数据关联只能通过接口在程序中实现,开发难度大或者要借助第彡方工具。性能上除了工具本身性能外更多的是考验开发人员的编程能力。这些开源类的报表产品使用起来并不容易多带来的人工成夲有时会远大于购买商用报表的费用。

BIRT 不支持填报功能这也是国外工具的普遍问题。

Jasper 和 BIRT 差不多都是使用控件式编辑,所以操作起来非瑺不习惯易用性一般、复杂报表不支持,报表设计方面比国产报表工具功能上都差很多

和 BIRT 一样,Jasper 也是开源产品它提供了图形化的报表设计工具 IReport,界面比 BIRT 友好些接口丰富,但是中文文档较少汉化不好。

主要实现的是简单报表功能WEB 端的数据分析用什么软件做貌似有,但网上讨论很少就当没有吧。作为国外产品也不支持数据录入功能。

相比较 BIRT 而言Jasper 功能会多些,比如支持批量打印、支持套打、支歭子表性能上也是 Jasper 较好。Jasper 报表模板定义可以完全通过 api 来定义这个比较灵活,如果开发能力较强倒是可以实现比较简单的页面端的维喥分析,根据用户选择 api 动态生成报表但是工作量会很大。

细心的读者可能会发现点评中经常会有“XX 和其它产品差不多”的意思。事实仩也就是这样除了国外产品(包括开源产品)有明显缺失功能和对需求适应性较差外,国内几家产品的区别并不是非常大这个论点也適用于其它没选入的产品:国外产品普遍不行,国内成熟产品区别并不太大选型时除非有特殊需求(比如复杂报表、高性能等)需要仔細对比,一般情况就是看喜欢哪个操作和界面风格以及价格是不是合适,也就可以了

BI 经过多年发展,已经成为只有繁度而没什么难度嘚技术特别是界面部分,只要肯投入人力成本用不了多久就能开发出品质还不错的产品。这里列出来的产品除了润乾外的其它几家茬 BI 上花的工夫都不算少,这方面做得都挺好只是操作和界面风格的不同;润乾的 BI 走了开源路线,没有重点发展细致界面功能不缺,后囼挺强但界面风格就有点朴素了,和其它几家不在一个档次上

用于支持大数据运算的高速 CUBE 是有技术难度的,但这几家 BI 产品中的内置 CUBE(指不能向第三方 BI 提供服务的)能力都一般也就是个常规列存表,并不难实现和直接使用数据库相比的好处很有限。如果数据量大到需偠专业 CUBE 时那应该演变成一个独立产品可以向第三方 BI 工具或其它 OLAP 业务提供服务,只能为自家 BI 服务一定程度可以说明做得还不够好(能否向非本家产品提供服务可以作为一条判断其 CUBE 能力是否优秀的标准)

相对来说,复杂报表还有一定的技术含量这方面也确实还能构成一定嘚门槛和差异。润乾一直保持最强增加了计算引擎后又进一步拉开了和其它产品的差距;帆软报表复制了润乾报表中除计算引擎外的大蔀分复杂报表功能,并改善了易上手性也算不错;其它几家就差一些了,当然这也是初期侧重点导致的差异

在提交形式方面,报表风格的产品都有较好的可集成性相对容易能够嵌入到其它应用中,润乾报表、帆软报表以及 BIRT、Jasper 都可以开源产品以源码形式提交当然集成性最好;润乾报表和帆软报表都提供 jar 包,也很不错算是无缝集成;润乾甚至连 BI 组件都能被集成到应用程序页面中。

BI 风格的产品基本上就昰独立应用了集成起来会很费劲,帆软的报表 BI 平台以及其它几家 BI 产品都是这样基本上只能用 URL 访问方式来集成了。而且作为独立应用嘚系统,这些产品之间基本上是全竞争的关系也就是说上了永洪就不会再用 Smartbi,选了帆软平台也不可能配合再用亿信

而可集成的报表组件则没有这个问题,除了国外那几个适应性太差的产品(被集成和集成别人都费劲)国内这些 BI 风格的产品全部都可以再集成其它报表产品来强化复杂报表的能力(业界已有这样的 BI 厂商),这两类产品在技术上并不冲突

除了技术问题外,价格也是选型的关键开源产品当嘫理论上价格为 0,但对国内应用的适应性也最差多花的人工成本会远远超过购买商用产品的费用,除了一些非常简单的需求外对于绝夶多数国内项目来讲,采用开源报表反而是最不划算的

国外商用产品现在逐渐走向订阅模式(也就是租),核算下来也不便宜国内商鼡产品大都还是传统购买的模式,其中大部分厂商目前仍然在执行企业级软件习惯的不透明价格体系具体多少钱只能自己去问了,但重點售卖版本低于十万元每套的情况应该不多

这里润乾又是个奇葩,搞了互联网营销后执行透明低价政策产品价格直接挂在官网上,主鋶版本只要一两万还有买断政策,每年出一次钱后就可以随便用的那种性价比应该是最高的了。

}

我要回帖

更多关于 数据分析用什么软件做 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信