极速易用的开源MPP数据库

Apache Doris(Incubating) 是百度开源并贡献给Apache社区的分析型数据库。

百度数据仓库基于 Apache Doris(Incubating),仅需毫秒即可返回海量数据下的查询结果,可高效支持

实时数据分析等多种场景

* Apache、Apache Doris以及相关的开源产品的名称都归属于Apache 软件基金会。

* 百度数据仓库基于Apache Doris 提供云上托管服务和商业组件支持。

全新升级的产品架构

Doris支持10PB以上超大数据集的导入,与主流大数据生态打通并适配BI工具,

帮助业务人员快速洞察业务以辅助决策

架构图

快速满足多样化的数据分析需求

Doris在企业大数据体系下适用于多个应用场景,快速满足更多样化的数据分析需求

数仓查询加速

应用Doris解决传统数仓查询效率低下的困境,PB级别数据低至毫秒/秒级查询耗时,海量数据无缝应用,极大幅度加速数据决策效率。

实时数仓构建

Doris支持流式数据高效导入、业务指标实时聚合,保证业务数据得以实时洞察,并可以减少数据处理链路、统一数据流向,简化大数据平台架构。

多源联邦查询

通过Doris构建跨多个数据源的统一查询入口,实现实时数据和离线数据的联邦分析,满足数据分析人员更多元化的查询需求。

交互式数据分析

基于Doris和BI可视化工具构建交互式数据分析应用,对海量数据进行自助探查和多维度分析,实现对业务的深层探索和快速决策。

广泛认可的核心优势

极致性能

高效列式存储引擎和现代化MPP架构,结合智能物化视图技术、向量化执行引擎以及多种索引加速方式,实现极致的查询性能。

简单易用

完全兼容MySQL协议和标准SQL,用户使用友好。支持在线表结构变更和预聚合Rollup,与已有系统框架轻松融合。

流批一体

支持离线批量数据和实时流式数据高效导入,秒级实时性保证。多版本极机制结合导入事务支持,解决读写冲突并实现Exactly-Once。

极简运维

高度一体,无任何外部组件依赖,集群规模在线弹性伸缩。系统高可用,节点故障自动副本切换,数据分片自动负载均衡。

生态丰富

支持多种异构数据源加载访问,具备广泛的大数据生态兼容性,并与主流BI工具完成适配,实现数据处理到数据分析的生态闭环。

高并发

无并发瓶颈,真实生产环境下可支持上万用户同时使用。通过灵活的资源配置策略,同时满足高并发的点查询和高吞吐的大查询。

来自用户的肯定

Doris已经在美团、京东、小米等一线互联网公司得到广泛使用,超过200家企业

长期运行Doris在其生产环境中。

左右

知乎

基于Doris的知乎用户画像与实时数仓的架构与实践

支持实时业务分析、实时算法特征、用户画像三项核心业务流,显著提升对于时效性热点与潜力的感知力度与响应速度,大幅缩减运营、营销等业务场景中的人群定向成本,并对实时算法的准确率及业务核心指标带来明显增益。

查看更多

美团

Doris在美团外卖数仓中的应用实践

支撑数据分析产品数十个,整体想要达到ms级,通过一年来的应用以及不断改进升级,Doris的高可靠、高可用、高可扩展性也得到进一步验证,服务稳定可靠。

查看更多

小米

Doris的小米增长分析平台实践

Doris在小米上线至今,已经在海内外部署近十个集群,每天完成数万个在线分析查询,既大幅度提高查询性能,又简化了目前的数据分析架构。

查看更多

他们都在使用 Apache Doris

查看更多

Doris与用户共同成长

历经十余年发展历程,从支持百度内部的业务需求、到正式贡献给Apache社区

我们一直拥抱开源的力量,致力于帮助更多人更高效地洞察数据

2017

正式开源

在百度内部基本服务了所有的统计报表和多维分析需求,为了让Doris帮助更多人支持分析类业务需求,正式将Doris在Github上开源

2018

ApacheDoris

贡献给Apache 社区,更名为Apache Doris。目前Doris已在美团、京东、小米等一线互联网公司得到广泛运用,越来越多的开发者加入到Doris大家庭中

2019

提升生态能力

发布 0.9,0.10 社区版本,支持流式导入、Kafka数据订阅和Doris on ES,全面提升Doris的数据生态打通能力

2020

适用场景拓展

发布 0.11、0.12、0.13 社区版本,实现了新的列式存储格式,支持Spark Load、二级索引、物化视图等功能,极大扩展Doris的适用场景