`

infobright: 基于mysql的数据仓库(data warehouse)

阅读更多

前些天捧起hongqn拿给我的<mysql性能调优与架构设计>,翻起第一章,还没进入mysql的主题,就被另一个名字吸引住了:infobright,一个基于mysql的数据仓库系统实现,它已经是很多开源或商用BI系统的底层存储引擎。

根据这几天看到的介绍与白皮书,又做了些试验,依据自己的理解先作一个概述性的介绍,下次再描述一下infobright的技术架构。

infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一 个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,它的逻辑层是mysql的逻辑 层加上它自身的优化器。

几大优点:

1、高压缩比率,平均压缩比可达10:1,甚至可以达到40:1,我用infobright把3.1G的数据存成不足300M。

2、列存储,即使数据量十分巨大,查询速度也很快。用于数据仓库,处理海量数据没一套可不行。

3、不需要建索引,就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜索。

4、单一台服务器可以高效地读写30T数据。具有可扩展性,这里是指对于同样的查询,当数据量是10T时,它耗费的时间不应该比1T数据量时慢太多,基本是一个数量级内。

与mysql对比:

1、infobright适用于数据仓库场合,即非事务、非实时、非多并发;分析为主;存放既定的事实(基本不会再变),例如日志,或汇总的大量的 数据。所以它并不适合于应对来自网站用户的请求。实际上它取一条记录比mysql要慢很多,但它取100W条记录会比mysql快。

2、mysql的总数据文件占用空间通常会比实际数据多,因为它还有索引。infobright的压缩能力很强大,按列按不同类型的数据来压缩。

3、服务形式与接口跟mysql一致,可以用类似mysql的方式启用infobright服务,然后原来连接mysql的应用程序都可以以类似的方式连接与查询infobright。这对熟练mysql者来说是个福音,学习成本基本为0。

infobright有两个发布版:开源的ICE及闭源商用的IEE。ICE提供了足够用的功能,但不能INSERT,DELETE,UPDATE,只能LOAD DATA INFILE。IEE除提供更充分的功能外,据说查询速度也要更快。

参考:

1、infobright商业网站:http://www.infobright.com/

2、infobright社区交流网站:http://www.infobright.org/

3、mysql对infobright的介绍:http://dev.mysql.com/tech-resources/articles/datawarehousing_mysql_infobright.html

4、关于infobright的介绍视频:http://www.infobright.com/Resource-Library/Webcasts-Podcasts/?infobright_product_demo

转载请保留本文原始链接:http://www.wentrue.net/blog/?p=283

分享到:
评论

相关推荐

    infobright for windows 64 数据仓库

    infobright for windows 64 数据仓库 快速安装包

    infobright for windows 32 数据仓库

    infobright for windows 32 数据仓库 快速安装包

    开源MySQL高效数据仓库解决方案:Infobright详细介绍

    Infobright是开源的MySQL数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算(类似sum/avg/group by之类),infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗...

    windows下mysql数据仓库解决方案

    infobright是开源的MySQL数据仓库解决方案,引入了列存储方案,高强度的数据压缩,优化的统计计算

    mysql数据仓库文档

    ( MySQL数据仓库——InfoBright的源码安装及使用.txt )

    centos下mysql数据仓库解决方案

    infobright 是基于mysql的,但不装mysql亦可,因为它本身就自带了一个。mysql可以粗分为逻辑层和物理存储引擎,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像...

    基于MySQL和Infobright的数据仓库技术

    除非你最近在一个荒岛上,否则你不可能不知道,数据仓库/分析/商务智能(BI)领域正在飞速发展。许多年前,当行业分析师群体调查CIO最优先考虑的事时,BI排第十位。然而,他于2006年跃升到了第二位,今天,根据...

    infobright包

    Infobright最近有部分工作涉及到了 Infobright 数据仓库,就浏览了一些相关的资料,感觉很受启发。下面写一些感想,如有谬误,还请指正。 简单的来讲,Infobright 主要有下面的一些优点: 1. TB 级的数据存储和...

    mysql.rar_infobright

    实现了mysql数据库以及infobright数据仓库值减表的转存!压缩了空间!使其效率更好!

    infobright-4.0.6-0-x86_64-ice

    infobright ,一个基于mysql的数据仓库系统实现,它已经是很多开源或商用BI系统的底层存储引擎。

    infobright

    infobright-4.0.7,32位系统,32位。

    infobright-4.0.7-0-x86_64-ice.rpm 数据仓库

    nfobright for linux 64 数据仓库 快速安装包

    Infobright教程

    主要是对Infobright的概念、功能、应用进行了阐述。

    大数据处理的三大流程以及大数据的价值.doc

    挖掘数据 定义:基于前面的查询数据进行数据挖掘,来满足高级别 的数据分析需求。 特点和挑战:算法复杂,并且计算涉及的数据量和计算量都大。 使用的产品:R,Hadoop Mahout。 如果从企业决策的角度来看,在任何...

    infobright导入数据遇到特殊字符报错的解决方法

    主要介绍了infobright导入数据遇到特殊字符报错的解决方法,Infobright是开源的MySQL数据仓库解决方案,需要的朋友可以参考下

    infobright珍贵资料(官方)

    集齐了mysql官方网站和infobright官方网站的所有珍贵资料,对于学习和研究有很大的帮助

    2007数据分析与业务建模

    数据分析与业务建模:随着数据仓库的不断发展和成熟,“大数据”概念的风靡,有越来越多的相关产品出来,最常见的技术解决方案包括hadoop和hive,oracle,mysql的infobright,greenplum及nosql,或者多个结合使用。...

    infobright-社区版.zip

    https://www.infobright.org/downloads/ice/infobright-4.0.7-0-x86_64-ice.rpm

Global site tag (gtag.js) - Google Analytics