课程简介
在大数据处理领域,实时和离线各占非常大的比重,本套视频教程综合展示实时数据处理领域的一个重要应用:实时数仓项目。项目从数据采集开始,分别讲解了针对不同数据采取的不同采集策略,使用的不同数据采集工具。在数据处理部分,将实时采集的数据按照数据建模要求进行合理分层,使用当前最火热的实时计算引擎Flink,对实时计算结果进行可视化展示。
内容包括:搭建用户行为数据的实时数据采集框架Flume-Kafka-Flink;采用Canal、Maxwell、Flink CDC三种方案实现业务数据的实时采集;分层搭建实时数据仓库,包括ODS层、DWD层、DIM层、DWM层、DWS层、ADS层;数据可视化接口的实现;ClickHouse技术的深入讲解……
每一部分讲解均参照实际开发环境,提供了多种问题的解决方案,引导学员对问题进行更深层的思考。通过本套教程的学习,你将掌握企业实际开发中实时数仓搭建的全流程,深入理解Flink的高阶应用实例,掌握开发环节多种框架技术。教程总计40小时+,附赠全部视频、代码、笔记及资料。
教程涵盖的关键技术点:
数仓架构深入讲解、离线架构与实时架构对比分析、SpringBoot项目搭建讲解、Nginx安装配置使用、Flink CDC深入案例分析、Maxwell与Canal对比分析、使用侧输出流分流操作、Flink与HBase交互、Flink状态编程应用、Flink CEP循环模式匹配、双流join、旁路缓存、异步IO编码、ClickHouse多引擎讲解、Flink SQL、数据可视化接口编写、Flink实战优化方案等。
课程目录
- 001-课程介绍
- 002-项目介绍
- 003-采集模块-课程介绍
- 004-采集模块-数仓分层之为什么分层
- 005-采集模块-数仓分层之分层明细
- 006-采集模块-整体需求介绍
- 007-采集模块-离线架构分析之Sqoop&Flume
- 008-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决
- 009-采集模块-离线架构分析之Kafka
- 010-采集模块-离线架构分析之其他
- 011-采集模块-实时架构分析
- 012-采集模块-架构对比
- 013-采集模块-日志数据采集之需求分析
- 014-采集模块-日志数据采集之MockJar包测试
- 015-采集模块-日志数据采集之SpringBoot简单介绍
- 016-采集模块-日志数据采集之SpringBoot创建项目&简单测试
- 017-采集模块-日志数据采集之SpringBoot创建项目&加参数测试
- 018-采集模块-日志数据采集之数据落盘&写入Kafka 编码
- 019-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试
- 020-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试
- 021-采集模块-日志数据采集之Nginx 介绍
- 022-采集模块-日志数据采集之Nginx 安装&启动
- 023-采集模块-日志数据采集之Nginx 配置负载均衡&测试
- 024-采集模块-日志数据采集之集群测试
- 025-采集模块-业务数据采集之建库&建表
- 026-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比
- 027-采集模块-业务数据采集之FlinkCDC 介绍
- 028-采集模块-业务数据采集之FlinkCDC DataStream方式 编码
- 029-采集模块-业务数据采集之FlinkCDC DataStream方式 测试
- 030-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群
- 031-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测
- 032-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试
- 033-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 格
- 034-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 编
- 035-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 代
- 036-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比
- 037-采集模块-业务数据采集之Maxwell 安装说明&测试
- 038-采集模块-业务数据采集之Canal 安装说明&测试
- 039-采集模块-业务数据采集之CDC对比
- 040-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码
- 041-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试
- 042-DWD&DIM-课程介绍
- 043-DWD&DIM-行为数据 需求分析
- 044-DWD&DIM-行为数据 思路整理&消费Kafka数据
- 045-DWD&DIM-行为数据 将数据转换为JSON对象
- 046-DWD&DIM-行为数据 新老用户校验
- 047-DWD&DIM-行为数据 侧输出流&写入Kafka
- 048-DWD&DIM-行为数据 测试
- 049-DWD&DIM-业务数据之需求分析
- 050-DWD&DIM-业务数据之代码逻辑梳理
- 051-DWD&DIM-业务数据之代码编写 消费数据并过滤
- 052-DWD&DIM-业务数据之代码编写 读取配置表创建广播流
- 053-DWD&DIM-业务数据之代码编写 配置表字段分析&建表&JavaBean
- 054-DWD&DIM-业务数据之代码编写 开启配置表Binlog并测试
- 055-DWD&DIM-业务数据之代码编写 连接主流&广播流并分析业务逻辑
- 056-DWD&DIM-业务数据之代码编写 创建TableProcessFunction并初始化相关参数
- 057-DWD&DIM-业务数据之代码编写 处理广播流数据 解析数据&建表
- 058-DWD&DIM-业务数据之代码编写 处理广播流数据 写入状态
- 059-DWD&DIM-业务数据之代码编写 处理主流数据 读取状态&过滤字段
- 060-DWD&DIM-业务数据之代码编写 处理主流数据 补充SinkTable&分流
- 061-DWD&DIM-业务数据之代码编写 检查代码
- 062-DWD&DIM-业务数据之代码编写 测试准备
- 063-DWD&DIM-业务数据之代码编写 测试
- 064-DWD&DIM-业务数据之代码编写 将数据写入HBase 编码
- 065-DWD&DIM-业务数据之代码编写 将数据写入Kafka 编码
- 066-DWD&DIM-业务数据之整体测试 环境准备
- 067-DWD&DIM-业务数据之整体测试 测试完成
- 068-ODS&DWD&DIM-小总结
- 069-ODS&DWD&DIM-SQL分享 需求说明&建表&导数据
- 070-ODS&DWD&DIM-SQL分享 方案一
- 071-ODS&DWD&DIM-SQL分享 方案二
- 072-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明
- 073-DWM层-需求分析
- 074-DWM层-访客UV 需求分析
- 075-DWM层-访客UV 代码编写 消费数据并转换为JSON对象
- 076-DWM层-访客UV 代码编写 过滤数据
- 077-DWM层-访客UV 代码编写 设置状态超时时间防止状态过大
- 078-DWM层-访客UV 代码测试
- 079-DWM层-跳出明细 需求分析
- 080-DWM层-跳出明细 代码编写
- 081-DWM层-跳出明细 代码测试
- 082-DWM层-跳出明细 测试
- 083-DWM层-跳出明细 CEP 循环模式
- 084-DWM层-订单宽表 需求分析
- 085-DWM层-订单宽表 双流JOIN 官方文档说明
- 086-DWM层-订单宽表 双流JOIN 代码编写
- 087-DWM层-订单宽表 双流JOIN 代码测试
- 088-DWM层-订单宽表 代码编写 消费Kafka数据&转换JavaBean&提取事件时间
- 089-DWM层-订单宽表 代码编写 订单与订单明细表双流JOIN
- 090-DWM层-订单宽表 代码测试 准备工作
- 091-DWM层-订单宽表 代码测试 测试完成
- 092-DWM层-订单宽表 关联维度 思路梳理
- 093-DWM层-订单宽表 关联维度 JDBCUtil 返回值&参数说明
- 094-DWM层-订单宽表 关联维度 JDBCUtil 查询&封装泛型对象
- 095-DWM层-订单宽表 关联维度 JDBCUtil 测试
- 096-DWM层-订单宽表 关联维度 DimUtil封装&优化的必要性
- 097-DWM层-订单宽表 关联维度 优化1旁路缓存 思路分析
- 098-DWM层-订单宽表 关联维度 优化1旁路缓存 Redis工具类&Key的设计
- 099-DWM层-订单宽表 关联维度 优化1旁路缓存 代码编写
- 100-DWM层-订单宽表 关联维度 优化1旁路缓存 代码测试
- 101-DWM层-订单宽表 回顾
- 102-DWM层-订单宽表 关联维度 优化2 异步IO说明
- 103-DWM层-订单宽表 关联维度 优化2 异步IO编码步骤
- 104-DWM层-订单宽表 关联维度 优化2 异步IO编码 初始化函数
- 105-DWM层-订单宽表 关联维度 优化2 异步IO编码 异步函数完成
- 106-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试准备
- 107-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试完成
- 108-DWM层-订单宽表 关联维度 补充其他维度信息
- 109-DWM层-订单宽表 最终测试
- 110-DWM层-订单宽表 不丢维度数据说明
- 111-DWM层-支付宽表 需求分析
- 112-DWM层-支付宽表 代码编写
- 113-DWM层-支付宽表 代码测试
- 114-DWM层-支付宽表 时间工具类说明
- 115-DWS层-课程介绍
- 116-DWS层-访客主题宽表 需求分析
- 117-DWS层-访客主题宽表 思路整理&读取Kafka数据
- 118-DWS层-访客主题宽表 处理输出流&union&提取时间戳分组
- 119-DWS层-访客主题宽表 开窗&聚合
- 120-DWS层-访客主题宽表 打印测试
- 121-DWS层-ClickHouse 课程介绍
- 122-DWS层-ClickHouse 概述&特点
- 123-DWS层-ClickHouse 安装准备工作
- 124-DWS层-ClickHouse 安装&启动
- 125-DWS层-ClickHouse 数据类型
- 126-DWS层-ClickHouse 简单引擎介绍
- 127-DWS层-ClickHouse MergeTree
- 128-DWS层-ClickHouse MergeTree之Partition By
- 129-DWS层-ClickHouse MergeTree之Primary Key
- 130-DWS层-ClickHouse MergeTree之Order By
- 131-DWS层-ClickHouse MergeTree之TTL
- 132-DWS层-ClickHouse ReplacingMergeTree
- 133-DWS层-ClickHouse SummingMergeTree
- 134-DWS层-ClickHouse 引擎选择分析
- 135-DWS层-ClickHouse SQL操作 一
- 136-DWS层-ClickHouse SQL操作 二
- 137-DWS层-ClickHouse 副本机制
- 138-DWS层-ClickHouse 分片机制 说明
- 139-DWS层-ClickHouse 分片机制 实操
- 140-DWS层-访客主题 ClickHouseUtil 创建
- 141-DWS层-访客主题 ClickHouseUtil 封装
- 142-DWS层-访客主题 ClickHouseUtil 封装完成
- 143-DWS层-访客主题 ClickHouseUtil 测试完成
- 144-DWS层-商品主题 需求分析
- 145-DWS层-商品主题 JavaBean说明
- 146-DWS层-商品主题 代码编写 思路整理&消费数据创建流
- 147-DWS层-商品主题 代码编写 处理页面日志&收藏数据&购物车数据
- 148-DWS层-商品主题 代码编写 处理订单&支付数据
- 149-DWS层-商品主题 代码编写 处理退单&评价数据
- 150-DWS层-商品主题 代码编写 分组开窗&聚合
- 151-DWS层-商品主题 代码编写 关联维度&将数据写入ClickHouse
- 152-DWS层-商品主题-整体测试
- 153-DWS层-商品主题-需求分析
- 154-DWS层-商品主题 代码编写 创建环境&使用DDL方式读取Kafka数据
- 155-DWS层-商品主题 代码编写 分组开窗聚合
- 156-DWS层-商品主题 代码编写 将动态表转换为流并打印
- 157-DWS层-商品主题 代码编写 将数据写入ClickHouse&测试
- 158-DWS层-关键词主题 需求分析
- 159-DWS层-关键词主题 代码编写 分词工具类封装
- 160-DWS层-关键词主题 代码编写 分词UDTF
- 161-DWS层-关键词主题 代码编写 思路分析&读取数据&建表
- 162-DWS层-关键词主题 代码编写 分词&开窗聚合
- 163-DWS层-关键词主题 代码编写 动态表转换为流&写入ClickHouse
- 164-DWS层-关键词主题 代码测试
- 165-数据可视化-课程介绍
- 166-数据可视化-Sugar 创建大屏
- 167-数据可视化-Sugar 使用步骤介绍
- 168-数据可视化-数据接口 项目构建
- 169-数据可视化-数据接口 依赖导入&分层说明
- 170-数据可视化-数据接口 GMV接口 Mapper完成
- 171-数据可视化-数据接口 GMV接口 Service&Controller完成
- 172-数据可视化-数据接口 GMV接口 测试
- 173-数据可视化-数据接口 GMV接口 对接Sugar
- 174-数据可视化-数据接口 品牌GMV接口 Mapper完成
- 175-数据可视化-数据接口 品牌GMV接口 Service完成
- 176-数据可视化-数据接口 品牌GMV接口 Controller完成
- 177-数据可视化-数据接口 品牌GMV接口 测试完成
- 178-数据可视化-数据接口 品牌GMV接口 对接Sugar
- 179-数据可视化-数据接口 导入代码&品类GMV&SPU GMV
- 180-数据可视化-数据接口 其他需求图表
- 181-数据可视化-最终测试
- 182-Flink优化-课程介绍
- 183-Flink优化-资源优化之内存设置
- 184-Flink优化-资源优化之并行度设置
- 185-Flink优化-资源优化之RockDB配置
- 186-Flink优化-资源优化之CheckPoint配置
- 187-Flink优化-资源优化之ParameterTool的介绍
- 188-Flink优化-反压处理之反压介绍&定位
- 189-Flink优化-反压处理之反压问题解决
- 190-Flink优化-数据倾斜之定位问题
- 191-Flink优化-数据倾斜之KeyBy之前的数据倾斜
- 192-Flink优化-数据倾斜之KeyBy之后直接聚合
- 193-Flink优化-数据倾斜之KeyBy之后开窗聚合
- 194-Flink优化-KafkaSource
- 195-Flink优化-FlinkSQL优化之MiniBatch
- 196-Flink优化-FlinkSQL优化之LocalGlobal
- 197-Flink优化-FlinkSQL优化之SplitDistinct
- 198-Flink优化-FlinkSQL优化之Agg With Filter
- 199-Flink优化-FlinkSQL优化之TopN优化
- 200-Flink优化-FlinkSQL优化之去重方案&其他
免责声明:
①本站所有资源均由用户自发贡献上传,用户自发分享网盘链接,仅限用于试看学习和参考,不得将上述资源用于商业或其它非法用途,否则一切后果请用户自负,与本站无关。
②本站所有资源均为免费提供,目的是让大家节省学习和摸索的成本,所收取的相应费用并非资源销售费用,而是打赏捐赠给资源提供者收集、整理、后期维护服务的辛苦费,与本站无利益关联。若需提供增值服务,则额外打赏资源提供者即可!
③资源下载后,请于24小时内从您的电脑中彻底删除!如您喜欢请移步官方网站购买,将得到更好的学习交流服务。
④所有资源均来自网络,版权归原作者所有,本站仅提供展示信息,一切问题与本站无关!
⑤如若侵犯到您的权益,请提供相关证明文件,按处理流程给我们反馈【侵权资源处理流程】,我们将在72小时内处理!如没有提供相关文件,一律视为诈骗恶搞,将拉黑处理!
①本站所有资源均由用户自发贡献上传,用户自发分享网盘链接,仅限用于试看学习和参考,不得将上述资源用于商业或其它非法用途,否则一切后果请用户自负,与本站无关。
②本站所有资源均为免费提供,目的是让大家节省学习和摸索的成本,所收取的相应费用并非资源销售费用,而是打赏捐赠给资源提供者收集、整理、后期维护服务的辛苦费,与本站无利益关联。若需提供增值服务,则额外打赏资源提供者即可!
③资源下载后,请于24小时内从您的电脑中彻底删除!如您喜欢请移步官方网站购买,将得到更好的学习交流服务。
④所有资源均来自网络,版权归原作者所有,本站仅提供展示信息,一切问题与本站无关!
⑤如若侵犯到您的权益,请提供相关证明文件,按处理流程给我们反馈【侵权资源处理流程】,我们将在72小时内处理!如没有提供相关文件,一律视为诈骗恶搞,将拉黑处理!