Categories
ClickHouse

ClickHouse ReplacingMergeTree数据更新方案

本文介绍ReplacingMergeTree引擎在分布式场景下的数据更新方式。

Categories
ClickHouse

ClickHouse 2020 RoadMap

Clickhouse 2020 RoadMap,文档为俄文,翻译自 Google Translate

Categories
理解计算机

高性能编程

在大量数据处理的场景下,对于程序要求极致的性能,本文尝试总结针对目前硬件特性的一些高效编程的方式

Categories
数据库

ORC字典实现

本文分析ORC中字典的实现

Categories
数据库

Presto兼容Hive语法语义的一些改动

本文介绍Presto的语法和语义向Hive兼容的一些改造工作。

Categories
数据库

Druid存储结构

Apache Druid是一款优秀的OLAP引擎,众所周知数据存储格式对一款存储系统来说是最核心的组件,Druid的数据格式是自定义的,以此保证了在海量数据下的亚秒级查询。本文深入分析Druid V1版本数据存储格式,包括索引结构和数据在磁盘中的存储方式。在阅读本文之前希望您对Druid和数据存储有简单了解。

Categories
数据库

KYLIN、DRUID、CLICKHOUSE核心技术对比

KYLIN、DRUID、CLICKHOUSE是目前主流的OLAP引擎,本文尝试从数据模型和索引结构两个角度,分析这几个引擎的核心技术,并做简单对比。在阅读本文之前希望能对KYLIN、DRUID、CLICKHOUSE有所理解。

Categories
数据库

Kylin数据模型

Apache Kylin是一款国人主导的优秀的OLAP引擎,工作中对Kylin有大规模的使用,尝试总结Kylin核心技术,本文是第一篇,偏向数据模型方面。

Categories
工作总结

一次Druid crash问题分析

记录一次生产环境Druid崩溃问题分析。

Categories
语言基础

How Java object layout in memory?

As we all know in database query is about computation. Computation requires data deserialized as objects in memory. So how object layout in memory and how many memory it cost is very important especially for waste memory operators like group-by, join, count-distinct etc.