最近开始做一个大规模数据分析的项目,一直在看一些BI方面的东西,每接触到一种新技术,就像站在一个山顶,先要站在制高点去眺望山下都有什么,才知道哪个方向的风景最有魅力,卖弄完毕,开始总结下这几天看到的一些对于BI方面的整体介绍。
BI(商业智能),英文名就是Business Intelligence,简单的来说就是将我们目前的数据转化为知识,为企业决策提供支持,让企业在以后的决策上少走弯路。准确的定义是:BI(Business Intelligence) 是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。
举个入门级的例子吧!虽然很入门。
假如你是一个销售公司的老板,公司的业务面比较广泛,随着时间的积累,慢慢有了长达几年的各个方面的数据,不管这些数据是自己公司,或者来源于竞争对手的业绩数据,这些数据越来越多,也越来越占用空间,可是丢掉也觉得弃之不舍,又不知道这么一大堆的数据用处是什么?这个时候BI就派上用场了,特别是在大量的数据处理上,能通过提取转换,很直观(通常是各种报表形式)的反应给公司管理人员,这样你就知道你竞争对手的各个方面的业务状况,也很清晰的看到自己各个业务的进展和发展状况,对于公司以后发展方向很可能起着决定性作用,这个时候,可以说BI就相当于指挥棒。
BI不是一门新的技术,而是很多技术的一个综合,比如数据仓库用到ETL,在线分析OLAP,数据挖掘,不管怎么说BI离不开数据,特别是在这个大数据的年代!
BI从上个世纪1996年提出,国内的发展也有十年之久,目前已经有一些比较成熟的解决方案,主要说一些用的多的吧,Obviously,用的多,基本上就是开源的了。
1.Mondrian
Mondrian不能算一个方案,可是目前很多方案都不能离开它。Mondrian是用java编写的一个开源OLAP(在线联机分析)引擎,实现了xmla和jolap规范,而且自定义了一种使用mdx语言的客户端接口,MDX简单来说就是基于SQL的进行多维分析的查询语句吧。这些后面细说。Mondrian是一个OLAP服务器,也就是说不是数据仓库服务器,不负责存储等方面的任务,Mondrian从数据仓库中取出数据,然后转换为多维数据模型,放到内存中,它的主要任务就是数据的转换和提取。
2.JPivot
JPivot也不是一个完整解决方案,但是也是一个开源的项目,负责数据的渲染展现。简单说就是一个基于WCF(Web Compont Framework)的jsp标签库,它的数据基于Mondrian服务器,分析结果通过若干个报表,并且可以导出Excel(其实Excel也可以算个简单的BI分析工具)和PDF。个人觉得呢,Mondrian和JPivot可以算是一对基佬,很多方案都是基于Mondrian+JPivot,另外加上一套报表工具和数据仓库等东东。还有不得不吐槽的是JPivot的画面,工具栏缺少亲和力。
3. OpenI
OpenI算是一个轻量级的BI工具,基于Mondrian和JPivot,侧重于数据展现,Openi是一个Java开发的Web应用,能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署,界面美观友好,后续还将支持数据挖掘和ETL等。
Openi主要包括:
1、 OLAP展示:JPivot
2、 报表工具:JFreeChart
3、 分析数据源连接器
由于OpenI也看不惯JPivot的界面,所以对部分功能进行了改善,比较友好,而且易于部署,目前比较成熟,适用于中小型项目开发。
4. JasperSoft
JasperSoft 和OpenI比较类型,都是基于Mondrian+JPivot,由于是做报表(JasperReports起家),所以JasperSoft 的报表功能比OpenI较强大,基于世界上最流行的开源 JAVA 报表库及图形化的报表设计工具-JasperReport和iReport,报表内容比较丰富全面
5.SpagoBI
SpagoBI是一个重量级适用于大型企业的成熟开源解决方案,统一集成了Mondrain和JProvit,能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发,所以适用性较强。它主要包括:
1、 报表工具:JasperReports /Eclipse BIRT/ iReport
2、 OLAP Server:Mondrian
3、 OLAP展示:JPivot
4、 数据挖掘组件:Weka
5、 Map引擎:Geo
6、 ETL:BIE
7、 搜索引擎:Lucene
8、 Dashboard:OpenLaszlo
9、 Portal Server:JBoss/ Tomcat/ JOnAS
它涵盖了一个BI系统所有方面的功能,包括:数据挖掘、查询、分析、报告、Dashboard仪表板等等。功能强大全面,系统架构合理。
6. Pentaho
Pentaho是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。目前pentaho资料比较全面而且竟然有专门的中文文档,说明还是很注意中国市场的,连Mondrian都加入了pentaho,国内一些大型的BI方案使用pentaho的比较多。最后还要提出一点的是,SpagoBI和Pentaho都是基于Mondrian和JPivot的,所以理解Mondrian和JPivot的内部结构还是很有必要的,虽然这几天看JPivot的源代码看的要吐,而且JPivot代码有一定的可优化性。
最后是一些官方链接
Mondrian http://sourceforge.net/projects/mondrian/
JPivot http://jpivot.sourceforge.net/
OpenI http://openi.org/
JasperSoft http://www.jaspersoft.com/
SpagoBI http://www.spagoworld.org/
Pentaho http://www.pentaho.com/
相关推荐
2.1 开源BI工具简介 13 2.1.1 Bizgre 13 2.1.2 Openi 13 2.1.3 Pentaho 13 2.1.4 SpagoBI 14 2.1.5 Saiku 14 2.2开源BI工具对比 14 2.3 开源展现样例 19 2.2.1 Saiku2.5 19 2.2.2 Openi2.0 21 2.2.3 Mondrian&Jpivot...
MOLAP已成为中小企业管理决策的首选工具软件,与excel结合使用大大节省企业在IT方面的投入,而且简单易学,容易在公司内普及。 如对软件感兴趣,欢迎与我联系。 邮件:wormbus#163.com (请把#换成@)
metabase,一款开源的BI分析工具
BI开源报表工具调研报告,总结的挺好的,不多说,直接看文档
过去,有关企业数据分析的重担都压在IT部门,传统BI分析更多面向的是具有IT背景的人员。...但同时,分析工具毕竟作为一个系统架设在企业数据分析平台的前端,需要适应企业的复杂业态,于是自助式BI成了不二选择。
SAP-BO(概括) IBM-Cognos (概括) ORACLE-Hyperion(了解特性) MICROSOFT- Visual studio 2005/SQL SERVER 2005
kettle_使用中的一些常见问题.pdf Kettle_命令行使用.pdf kettle中文文档之output.pdf Kettle例子.pdf Kettle关于平面数据的导入.pdf Kettle初探.pdf Kettle命令行使用说明.pdf Kettle培训.ppt KETTLE基本...
前端开源库-powerbi-visuals-toolspower bi visuals工具,用于创建和发布powerbi visuals的命令行工具
通过使用PostgreSQL,Mondrian,Pentaho BI等开源产品,ETL工具可提供OrangeHRM开源版本的OLAP报告。 向我们发送您对报告的反馈
数据之魅:基于开源工具的数据分析 data-analysis-with-open-source-tools
NULL 博文链接:https://hudeyong926.iteye.com/blog/1583838
本文简介 介绍如何利用开源工具实现Oracle数据库环境中的TPC-C.对DBA、开发人员、BI实施者有一定的参考价值.
BI工具旨在为商业智能提供一套有用的工具和方法
在互联网数据大爆炸的这几年,各类数据处理、数据可视化的需求使得 GitHub 上诞生了一大批高质量的 BI 工具。 借助这些 BI 工具,我们能够大幅提升数据分析...DataEase 开源工具由 FIT2CLOUD 飞致云公司研发出品的。
项目需要,对开源的BI平台进行调研。本文档主要针对OpenI这个轻量级的BI平台进行调研分析,得出它的部署方法、实现框架、数据流程以及其使用的BI工具信息,并分析其交互内容。总括OpenI主要功能在于多维分析和报表...
Hadoop是个很流行的分布式计算解决方案,是Apache的一个开源项目名称,核心部分包括HDFS及MapReduce。其中,HDFS是分布式文件系统,MapReduce是分布式计算引擎。时至今日,Hadoop在技术上已经得到验证、认可甚至到了...
Visualis是一个基于宜信的开源项目Davinci开发的数据可视化BI工具。现已被集成到数据应用开发门户DataSphere Studio中。 Visualis支持拖拽式报表定义、图表联动、钻取、全局筛选、多维分析、实时查询等数据开发探索...
1.1.1. 独立功能项目 OLAP Server Mondrian ETL 工具 Enhydra Octopus,JasperETL OLAP客户端组件 Jpivot 报表引擎组件 JasperReport,JFreeChart,JfreeReport,BIRT 数据挖掘组件 Weka
包括完整的前后端源码,前端vue,后端springboot,系统包含数据导入、数据填报、数据建模、多维分析、数据查询、报表、数据大屏等功能模块,实现通过拖拽,快速搭建可视化界面的功能。
该工具允许连接到OPC UA和DA服务器,轮询数据并订阅事件,并使用OData Feed数据源将数据实时写入MS PowerBI。