极速易用的开源MPP数据库
Apache Doris(Incubating) 是百度开源并贡献给Apache社区的分析型数据库。
百度数据仓库基于 Apache Doris(Incubating),仅需毫秒即可返回海量数据下的查询结果,可高效支持
实时数据分析等多种场景
* Apache、Apache Doris以及相关的开源产品的名称都归属于Apache 软件基金会。
* 百度数据仓库基于Apache Doris 提供云上托管服务和商业组件支持。
Doris支持10PB以上超大数据集的导入,与主流大数据生态打通并适配BI工具,
帮助业务人员快速洞察业务以辅助决策
Doris在企业大数据体系下适用于多个应用场景,快速满足更多样化的数据分析需求
应用Doris解决传统数仓查询效率低下的困境,PB级别数据低至毫秒/秒级查询耗时,海量数据无缝应用,极大幅度加速数据决策效率。
Doris支持流式数据高效导入、业务指标实时聚合,保证业务数据得以实时洞察,并可以减少数据处理链路、统一数据流向,简化大数据平台架构。
通过Doris构建跨多个数据源的统一查询入口,实现实时数据和离线数据的联邦分析,满足数据分析人员更多元化的查询需求。
基于Doris和BI可视化工具构建交互式数据分析应用,对海量数据进行自助探查和多维度分析,实现对业务的深层探索和快速决策。
高效列式存储引擎和现代化MPP架构,结合智能物化视图技术、向量化执行引擎以及多种索引加速方式,实现极致的查询性能。
完全兼容MySQL协议和标准SQL,用户使用友好。支持在线表结构变更和预聚合Rollup,与已有系统框架轻松融合。
支持离线批量数据和实时流式数据高效导入,秒级实时性保证。多版本极机制结合导入事务支持,解决读写冲突并实现Exactly-Once。
高度一体,无任何外部组件依赖,集群规模在线弹性伸缩。系统高可用,节点故障自动副本切换,数据分片自动负载均衡。
支持多种异构数据源加载访问,具备广泛的大数据生态兼容性,并与主流BI工具完成适配,实现数据处理到数据分析的生态闭环。
无并发瓶颈,真实生产环境下可支持上万用户同时使用。通过灵活的资源配置策略,同时满足高并发的点查询和高吞吐的大查询。
历经十余年发展历程,从支持百度内部的业务需求、到正式贡献给Apache社区
我们一直拥抱开源的力量,致力于帮助更多人更高效地洞察数据
2017
在百度内部基本服务了所有的统计报表和多维分析需求,为了让Doris帮助更多人支持分析类业务需求,正式将Doris在Github上开源
2018
贡献给Apache 社区,更名为Apache Doris。目前Doris已在美团、京东、小米等一线互联网公司得到广泛运用,越来越多的开发者加入到Doris大家庭中
2019
发布 0.9,0.10 社区版本,支持流式导入、Kafka数据订阅和Doris on ES,全面提升Doris的数据生态打通能力
2020
发布 0.11、0.12、0.13 社区版本,实现了新的列式存储格式,支持Spark Load、二级索引、物化视图等功能,极大扩展Doris的适用场景