ClickHouse大数据分析技术与实战资源介绍:
本课程从零开始,有Linux操作系统和SQL使用经验即可。 课程以案例驱动,包含大量的实践案例。将ClickHouse与MySQL、Kafka、HDFS等第三方系统集成,增强ClickHouse的功能。课程覆盖面广,既有基础功能的详细讲解, 也包含了集群部署、查询优化、运维管理等高级内容。
资源目录:
第1章ClickHouse概述(31分钟2节) 1-1ClickHouse架构与场景概述[22:32] 1-2ClickHouse与典型大数据架构[09:10] 第2章ClickHouse基本使用(1小时21分钟5节) 2-1单机版安装部署[08:46] 2-2建表与测试数据导入[17:55] 2-3clickhouse-client的使用[20:29] 2-4MySQL接口操作ClickHouse[14:24] 2-5DBeaver可视化工具安装与使用[19:27] 第3章输入输出格式(1小时28分钟7节) 3-1TabSeparated系列格式[25:11] 3-2TSKV格式[05:42] 3-3CSV系列格式[05:56] 3-4JSON系列格式[23:45] 3-5Parquet格式[09:15] 3-6ORC格式[06:08] 3-7其他常用的数据格式[12:18] 第4章MergeTree系列引擎(1小时55分钟11节) 4-1表引擎概述[04:38] 4-2MergeTree系列引擎概述与存储结构[20:03] 4-3表和列的TTL规则与实践[13:42] 4-4自定义分区及底层存储合并机制[14:55] 4-5主键、索引的工作机制[05:51] 4-6数据标记的工作机制[11:34] 4-7ReplacingMergeTree引擎原理与实践[08:24] 4-8SummingMergeTree引擎原理与实践[05:46] 4-9AggregatingMergeTree引擎原理与实[09:08] 4-10CollapsingMergeTree引擎原理与实践[16:59] 4-11VersionedCollapsingMergeTr[04:51] 第5章 Log系列引擎 (4分钟 1节) 5-1Log系列引擎[04:16] 第6章 特定表功能表引擎 (27分钟 6节) 6-1Merge引擎[02:41] 6-2File引擎[03:24] 6-3外部数据[07:17] 6-4Null引擎使用场景与案例实践[04:02] 6-5URL引擎[03:23] 6-6其他引擎(Memory/Set/Buffer)[06:27] 第7章 集成第三方系统 (38分钟 4节) 7-1ClickHouse与Kafka整合[19:01] 7-2ClickHouse与MySQL整合[06:49] 7-3ClickHouse与HDFS整合[05:57] 7-4ClickHouse与JDBC整合[07:02] 第8章 分布式集群 (1小时15分钟 6节) 8-1分布式集群安装配置[27:30] 8-2副本同步和高可用功能验证[13:01] 8-3分布式表与集群配置[06:14] 8-4复制表与数据副本[14:01] 8-5数据的原子写入与去重[07:33] 8-6负载平衡策略[06:47] 第9章 数据查询 (2小时5分钟 19节) 9-1查询语句概述[01:33] 9-2WITH子句[07:39] 9-3FROM子句[02:32] 9-4SAMPLE子句[12:01] 9-5Array Join[12:16] 9-6JOIN子句[04:53] 9-7Strictness匹配逻辑[14:33] 9-8JOIN中的空值与NULL处理[03:02] 9-9WHERE和PREWHERE[06:01] 9-10GROUP BY子句[06:35] 9-11LIMIT BY子句[05:53] 9-12HAVING与ORDER BY子句[03:56] 9-13SELECT子句[04:07] 9-14DISTINCT子句[05:31] 9-15LIMIT子句[01:55] 9-16UNION ALL子句[03:48] 9-17INTO OUTFILE子句[04:40] 9-18IN操作符[05:54] 9-19ClickHouse常用操作符[18:50] 第10章 常用函数 (1小时52分钟 7节) 10-1常用的函数[05:11] 10-2类型转换相关函数[26:49] 10-3日期处理相关函数[21:52] 10-4字符串处理相关函数[17:26] 10-5字符串搜索与正则表达式[14:54] 10-6字符串替换相关函数[15:20] 10-7条件函数[11:20] 第11章 字典 (1小时17分钟 6节) 11-1字典概述与配置使用案例[15:59] 11-2字典在内存中的存放方式[24:51] 11-3字典的数据源[12:42] 11-4字典的更新[10:23] 11-5字典的key和属性[09:29] 11-6Hierarchical分层[03:52] 第12章 数据查询与写入优化 (48分钟 8节) 12-1分布式子查询优化[06:43] 12-2外部聚合/排序优化[03:32] 12-3基于JOIN引擎的优化[04:02] 12-4SQL优化改写案例[15:23] 12-5物化视图提速[04:30] 12-6查询优化常用经验法则[02:58] 12-7选择和主键不一样的排序健[06:34] 12-8数据入库性能优化[04:41] 第13章 运维管理与优化 (58分钟 5节) 13-1硬件选型与规划[06:19] 13-2操作系统的关键配置[04:41] 13-3ZooKeeper关键优化点[17:52] 13-4彻底理解配置文件[15:00] 13-5服务监控[14:57] 第14章 用户管理 (44分钟 5节) 14-1profile管理[10:18] 14-2quota管理[06:28] 14-3约束的使用[04:59] 14-4查询权限[08:07] 14-5用户管理[14:23]