尚硅谷大数据项目之电商数仓 价值272
尚硅谷大数据项目之电商数仓 价值272**** Hidden Message *****
课程介绍
一、课程简介
数据仓库(Data Warehouse,可简写为DW或DWH),是面向分析的集成化数据环境,为企业决策制定过程,提供系统数据支持的战略集合,是国内外各大公司正在重点投入的战略级技术领域。
二、课程内容
《尚硅谷_电商数仓项目实战》视频教程,从项目架构的搭建,到数据采集模块的设计、数仓架构的设计、实战需求实现、即席查询的实现,我们针对国内目前广泛使用的Apache原生框架和CDH版本框架进行了分别介绍,Apache原生框架介绍中涉及到的技术框架包括Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等,CDH版本框架讲解包括CM的安装部署、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark的安装配置,透彻了解不同版本框架的区别联系,将大数据全生态系统前沿技术一网打尽。在过程中对大数据生态体系进行了系统的讲解,对实际企业数仓项目中可能涉及到的技术点都进行了深入的讲解和探讨。同时穿插了大量数仓基础理论知识,让你在掌握实战经验的同时能够打下坚实的理论基础。
三、课程目标
本课程以国内电商巨头实际业务应用场景为依托,对电商数仓的常见实战指标以及难点实战指标进行了详尽讲解,具体指标包括:每日、周、月活跃设备明细,留存用户比例,沉默用户、回流用户、流失用户统计,最近连续3周活跃用户统计,最近7天内连续3天活跃用户统计,GMV成交总额分析,转化率及漏斗分析,品牌复购率分析、订单表拉链表的设计等,让学生拥有更直观全面的实战经验。通过对本课程的学习,对数仓项目可以建立起清晰明确的概念,系统全面的掌握各项数仓项目技术,轻松应对各种数仓难题。
四、课程亮点
本课程结合国内多家企业实际项目经验,特别加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建大数据集群。并且总结大量项目实战中会遇到的问题,针对各个技术框架,均有调优实战经验,具体包括:常用Linux运维命令、Hadoop集群调优、Flume组件选型及性能优化、Kafka集群规模确认及关键参数调优。通过这部分学习,助学生迅速成长,获取前沿技术经验,从容解决实战问题。
五、适合人群
1.有一定Java、Scala语言基础,希望了解大数据实际应用场景的编程人员
2.了解大数据相关知识,希望增加项目经验的大数据从业者
任务1-1: 01_尚硅谷_数仓项目介绍
任务1-2: 电商数仓源码笔记资料
任务2: 02_尚硅谷_数仓采集_用户行为采集课程介绍
任务3: 03_尚硅谷_数仓采集_数仓的概念
任务4: 04_尚硅谷_数仓采集_项目需求
任务5: 05_尚硅谷_数仓采集_项目技术选型
任务6: 06_尚硅谷_数仓采集_系统数据流程设计
任务7: 07_尚硅谷_数仓采集_框架版本选型
任务8: 08_尚硅谷_数仓采集_框架版本具体型号
任务9: 09_尚硅谷_数仓采集_服务器选型
任务10: 10_尚硅谷_数仓采集_集群资源规划设计
任务11: 11_尚硅谷_数仓采集_测试集群服务器规划
任务12: 12_尚硅谷_数仓采集_埋点数据基本格式
任务13: 13_尚硅谷_数仓采集_事件日志数据(上)
任务14: 14_尚硅谷_数仓采集_事件日志数据(下)
任务15: 15_尚硅谷_数仓采集_日志生成代码编写
任务16: 16_尚硅谷_数仓采集_Logback日志打印控制
任务17: 17_尚硅谷_数仓采集_服务器准备
任务18: 18_尚硅谷_数仓采集_Hadoop安装
任务19: 19_尚硅谷_数仓采集_项目经验之HDFS多目录配置
任务20: 20_尚硅谷_数仓采集_项目经验之支持LZO压缩配置
任务21: 21_尚硅谷_数仓采集_项目经验之基准测试
任务22: 22_尚硅谷_数仓采集_项目经验之HDFS参数调优
任务23: 23_尚硅谷_数仓采集_Zookeeper安装
任务24: 24_尚硅谷_数仓采集_项目经验之ZK集群启动停止脚本
任务25: 25_尚硅谷_数仓采集_生成测试日志
任务26: 26_尚硅谷_数仓采集_集群日志生成启动脚本
任务27: 27_尚硅谷_数仓采集_集群时间同步修改脚本
任务28: 28_尚硅谷_数仓采集_集群所有进程查看脚本
任务29: 29_尚硅谷_数仓采集_每日回顾
任务30: 30_尚硅谷_数仓采集_日志采集Flume安装
任务31: 31_尚硅谷_数仓采集_Flume组件及配置
任务32: 32_尚硅谷_数仓采集_日志采集Flume配置分析
任务33: 33_尚硅谷_数仓采集_ETL拦截器
任务34: 34_尚硅谷_数仓采集_分类型拦截器
任务35: 35_尚硅谷_数仓采集_日志采集Flume启动停止脚本
任务36: 36_尚硅谷_数仓采集_Kafka集群安装
任务37: 37_尚硅谷_数仓采集_Kafka集群启动停止脚本
任务38: 38_尚硅谷_数仓采集_Kafka Manager安装及脚本
任务39: 39_尚硅谷_数仓采集_项目经验之Kafka压力测试
任务40: 40_尚硅谷_数仓采集_项目经验之Kafka机器数量计算
任务41: 41_尚硅谷_数仓采集_消费Kafka数据Flume
任务42: 42_尚硅谷_数仓采集_项目经验之Flume内存优化
任务43: 43_尚硅谷_数仓采集_项目经验之Flume组件
任务44: 44_尚硅谷_数仓采集_采集通道启动停止脚本
任务45: 45_尚硅谷_数仓采集_调试经验
任务46: 46_尚硅谷_数仓采集_面试题(Linux、Shell、Hadoop)
任务47: 47_尚硅谷_数仓采集_面试题(Flume、Kafka)
任务48: 48_尚硅谷_用户行为数仓_每日回顾
任务49: 49_尚硅谷_用户行为数仓_用户行为数仓课程介绍
任务50: 50_尚硅谷_用户行为数仓_为什么要分层
任务51: 51_尚硅谷_用户行为数仓_数仓分层
任务52: 52_尚硅谷_用户行为数仓_数据集市与数据仓库概念
任务53: 53_尚硅谷_用户行为数仓_数仓命名规范
任务54: 54_尚硅谷_用户行为数仓_Hive&MySQL安装
任务55: 55_尚硅谷_用户行为数仓_Hive运行引擎Tez
任务56: 56_尚硅谷_用户行为数仓_项目经验之元数据备份
任务57: 57_尚硅谷_用户行为数仓_ODS层启动日志和事件日志表创建
任务58: 58_尚硅谷_用户行为数仓_ODS层加载数据脚本
任务59: 59_尚硅谷_用户行为数仓_DWD层启动日志建表及导入数据
任务60: 60_ 尚硅谷_用户行为数仓_DWD层启动表加载数据脚本
任务61: 61_尚硅谷_用户行为数仓_DWD层事件基础明细表创建
任务62: 62_尚硅谷_用户行为数仓_自定义UDF函数(解析公共字段)
任务63: 63_尚硅谷_用户行为数仓_自定义UDTF函数(解析事件日志基础明细表)
任务64: 64_尚硅谷_用户行为数仓_DWD层数据解析脚本
任务65: 65_尚硅谷_用户行为数仓_DWD层事件表加载数据脚本
任务66: 66_尚硅谷_用户行为数仓_今日回顾
任务67: 67_尚硅谷_用户行为数仓_业务术语
任务68: 68_尚硅谷_用户行为数仓_日期的系统函数
任务69: 69_尚硅谷_用户行为数仓_每日活跃设备明细
任务70: 70_尚硅谷_用户行为数仓_每周活跃设备明细
任务71: 71_尚硅谷_用户行为数仓_每月活跃设备明细
任务72: 72_尚硅谷_用户行为数仓_DWS层加载数据脚本
任务73: 73_尚硅谷_用户行为数仓_需求一:ADS层日活、周活、月活用户数
任务74: 74_尚硅谷_用户行为数仓_每日新增设备明细表
任务75: 75_尚硅谷_用户行为数仓_需求二:ADS层每日新增设备表
任务76: 76_尚硅谷_用户行为数仓_用户留存分析
任务77: 77_尚硅谷_用户行为数仓_1、2、3、n日留存用户明细
任务78: 78_尚硅谷_用户行为数仓_需求三:ADS层留存用户和留存比率
任务79: 79_尚硅谷_用户行为数仓_新数据准备
任务80: 80_尚硅谷_用户行为数仓_需求四:沉默用户
任务81: 81_尚硅谷_用户行为数仓_需求五:本周回流用户数
任务82: 82_尚硅谷_用户行为数仓_需求六:流失用户
任务83: 83_尚硅谷_用户行为数仓_需求七:最近连续3周活跃用户数
任务84: 84_尚硅谷_用户行为数仓_需求八:最近七天内连续三天活跃用户数
任务85: 85_尚硅谷_用户行为数仓_用户行为数仓业务总结
任务86: 86_尚硅谷_用户行为数仓_Hive企业面试题总结
任务87: 87_尚硅谷_业务数仓_业务数仓课程介绍
任务88: 88_尚硅谷_业务数仓_电商业务与数据结构简介
任务89: 89_尚硅谷_业务数仓_表的分类
任务90: 90_尚硅谷_业务数仓_同步策略
任务91: 91_尚硅谷_业务数仓_范式理论
任务92: 92_尚硅谷_业务数仓_雪花模型、星型模型和星座模型
任务93: 93_尚硅谷_业务数仓_配置Hadoop支持Snappy压缩
任务94: 94_尚硅谷_业务数仓_业务数据生成
任务95: 95_尚硅谷_业务数仓_Sqoop安装及参数
任务96: 96_尚硅谷_业务数仓_Sqoop导入数据
任务97: 97_尚硅谷_业务数仓_ODS层建表及数据导入
任务98: 98_尚硅谷_业务数仓_DWD层建表及导入数据
任务99: 99_尚硅谷_业务数仓_需求讲解
任务100: 100_尚硅谷_业务数仓_DWS层之用户行为宽表
任务101: 101_尚硅谷_业务数仓_需求九:GMV成交总额
任务102: 102_尚硅谷_业务数仓_需求十:ADS层之新增用户占日活跃用户比率
任务103: 103_尚硅谷_业务数仓_需求十一:ADS层之用户行为漏斗分析
任务104: 104_尚硅谷_业务数仓_用户购买商品明细表(宽表)
任务105: 105_尚硅谷_业务数仓_需求十二:ADS层品牌复购率
任务106: 106_尚硅谷_业务数仓_需求十三:求每个等级的用户对应的复购率前十的商品排行(学生分享)
任务107: 107_尚硅谷_业务数仓_数据可视化
任务108: 108_尚硅谷_业务数仓_Azkaban安装
任务109: 109_尚硅谷_业务数仓_GMV指标获取的全调度流程
任务110: 110_尚硅谷_业务数仓_拉链表理论
任务111: 111_尚硅谷_业务数仓_拉链表制作
任务112: 112_尚硅谷_业务数仓_业务数仓项目总结
任务113: 113_尚硅谷_业务数仓_即席数仓课程介绍
任务114: 114_尚硅谷_即席数仓_Presto简介
任务115: 115_尚硅谷_即席数仓_Presto安装及使用
任务116: 116_尚硅谷_即席数仓_Presto优化
任务117: 117_尚硅谷_即席数仓_Druid概念、特点、场景
任务118: 118_尚硅谷_即席数仓_Druid对比其他框架
任务119: 119_尚硅谷_即席数仓_Druid框架原理
任务120: 120_尚硅谷_即席数仓_Druid数据结构
任务121: 121_尚硅谷_即席数仓_Druid安装
任务122: 122_尚硅谷_面试题_总体架构
任务123: 123_尚硅谷_面试题_技术框架
任务124: 124_尚硅谷_面试题_用户行为、业务数据、即席查询
任务125: 125_尚硅谷_面试题_开发经验
任务126: 126_尚硅谷_CDH数仓_课程介绍
任务127: 127_尚硅谷_CDH数仓_CM简介及架构
任务128: 128_尚硅谷_CDH数仓_CM安装环境准备
任务129: 129_尚硅谷_CDH数仓_CM、Hadoop、Zookeeper安装
任务130: 130_尚硅谷_CDH数仓_采集Flume的安装
任务131: 131_尚硅谷_CDH数仓_Kafka安装
任务132: 132_尚硅谷_CDH数仓_测试Flume和Kafka安装
任务133: 133_尚硅谷_CDH数仓_消费Flume配置完成
任务134: 134_尚硅谷_CDH数仓_Hive、Oozie、Hue安装
任务135: 135_尚硅谷_CDH数仓_用户行为数仓ODS层导数据
任务136: 136_尚硅谷_CDH数仓_用户行为数仓完结
任务137: 137_尚硅谷_CDH数仓_业务数据生成
任务138: 138_尚硅谷_CDH数仓_业务数仓完结
任务139: 139_尚硅谷_CDH数仓_Oozie执行前准备
任务140: 140_尚硅谷_CDH数仓_Oozie任务编写及运行
任务141: 141_尚硅谷_CDH数仓_即席查询数仓搭建Impala
任务142: 142_尚硅谷_CDH数仓_Spark安装及总结任务1-1: 01_尚硅谷_数仓项目介绍
任务1-2: 电商数仓源码笔记资料
任务2: 02_尚硅谷_数仓采集_用户行为采集课程介绍
任务3: 03_尚硅谷_数仓采集_数仓的概念
任务4: 04_尚硅谷_数仓采集_项目需求
任务5: 05_尚硅谷_数仓采集_项目技术选型
任务6: 06_尚硅谷_数仓采集_系统数据流程设计
任务7: 07_尚硅谷_数仓采集_框架版本选型
任务8: 08_尚硅谷_数仓采集_框架版本具体型号
任务9: 09_尚硅谷_数仓采集_服务器选型
任务10: 10_尚硅谷_数仓采集_集群资源规划设计
任务11: 11_尚硅谷_数仓采集_测试集群服务器规划
任务12: 12_尚硅谷_数仓采集_埋点数据基本格式
任务13: 13_尚硅谷_数仓采集_事件日志数据(上)
任务14: 14_尚硅谷_数仓采集_事件日志数据(下)
任务15: 15_尚硅谷_数仓采集_日志生成代码编写
任务16: 16_尚硅谷_数仓采集_Logback日志打印控制
任务17: 17_尚硅谷_数仓采集_服务器准备
任务18: 18_尚硅谷_数仓采集_Hadoop安装
任务19: 19_尚硅谷_数仓采集_项目经验之HDFS多目录配置
任务20: 20_尚硅谷_数仓采集_项目经验之支持LZO压缩配置
任务21: 21_尚硅谷_数仓采集_项目经验之基准测试
任务22: 22_尚硅谷_数仓采集_项目经验之HDFS参数调优
任务23: 23_尚硅谷_数仓采集_Zookeeper安装
任务24: 24_尚硅谷_数仓采集_项目经验之ZK集群启动停止脚本
任务25: 25_尚硅谷_数仓采集_生成测试日志
任务26: 26_尚硅谷_数仓采集_集群日志生成启动脚本
任务27: 27_尚硅谷_数仓采集_集群时间同步修改脚本
任务28: 28_尚硅谷_数仓采集_集群所有进程查看脚本
任务29: 29_尚硅谷_数仓采集_每日回顾
任务30: 30_尚硅谷_数仓采集_日志采集Flume安装
任务31: 31_尚硅谷_数仓采集_Flume组件及配置
任务32: 32_尚硅谷_数仓采集_日志采集Flume配置分析
任务33: 33_尚硅谷_数仓采集_ETL拦截器
任务34: 34_尚硅谷_数仓采集_分类型拦截器
任务35: 35_尚硅谷_数仓采集_日志采集Flume启动停止脚本
任务36: 36_尚硅谷_数仓采集_Kafka集群安装
任务37: 37_尚硅谷_数仓采集_Kafka集群启动停止脚本
任务38: 38_尚硅谷_数仓采集_Kafka Manager安装及脚本
任务39: 39_尚硅谷_数仓采集_项目经验之Kafka压力测试
任务40: 40_尚硅谷_数仓采集_项目经验之Kafka机器数量计算
任务41: 41_尚硅谷_数仓采集_消费Kafka数据Flume
任务42: 42_尚硅谷_数仓采集_项目经验之Flume内存优化
任务43: 43_尚硅谷_数仓采集_项目经验之Flume组件
任务44: 44_尚硅谷_数仓采集_采集通道启动停止脚本
任务45: 45_尚硅谷_数仓采集_调试经验
任务46: 46_尚硅谷_数仓采集_面试题(Linux、Shell、Hadoop)
任务47: 47_尚硅谷_数仓采集_面试题(Flume、Kafka)
任务48: 48_尚硅谷_用户行为数仓_每日回顾
任务49: 49_尚硅谷_用户行为数仓_用户行为数仓课程介绍
任务50: 50_尚硅谷_用户行为数仓_为什么要分层
任务51: 51_尚硅谷_用户行为数仓_数仓分层
任务52: 52_尚硅谷_用户行为数仓_数据集市与数据仓库概念
任务53: 53_尚硅谷_用户行为数仓_数仓命名规范
任务54: 54_尚硅谷_用户行为数仓_Hive&MySQL安装
任务55: 55_尚硅谷_用户行为数仓_Hive运行引擎Tez
任务56: 56_尚硅谷_用户行为数仓_项目经验之元数据备份
任务57: 57_尚硅谷_用户行为数仓_ODS层启动日志和事件日志表创建
任务58: 58_尚硅谷_用户行为数仓_ODS层加载数据脚本
任务59: 59_尚硅谷_用户行为数仓_DWD层启动日志建表及导入数据
任务60: 60_ 尚硅谷_用户行为数仓_DWD层启动表加载数据脚本
任务61: 61_尚硅谷_用户行为数仓_DWD层事件基础明细表创建
任务62: 62_尚硅谷_用户行为数仓_自定义UDF函数(解析公共字段)
任务63: 63_尚硅谷_用户行为数仓_自定义UDTF函数(解析事件日志基础明细表)
任务64: 64_尚硅谷_用户行为数仓_DWD层数据解析脚本
任务65: 65_尚硅谷_用户行为数仓_DWD层事件表加载数据脚本
任务66: 66_尚硅谷_用户行为数仓_今日回顾
任务67: 67_尚硅谷_用户行为数仓_业务术语
任务68: 68_尚硅谷_用户行为数仓_日期的系统函数
任务69: 69_尚硅谷_用户行为数仓_每日活跃设备明细
任务70: 70_尚硅谷_用户行为数仓_每周活跃设备明细
任务71: 71_尚硅谷_用户行为数仓_每月活跃设备明细
任务72: 72_尚硅谷_用户行为数仓_DWS层加载数据脚本
任务73: 73_尚硅谷_用户行为数仓_需求一:ADS层日活、周活、月活用户数
任务74: 74_尚硅谷_用户行为数仓_每日新增设备明细表
任务75: 75_尚硅谷_用户行为数仓_需求二:ADS层每日新增设备表
任务76: 76_尚硅谷_用户行为数仓_用户留存分析
任务77: 77_尚硅谷_用户行为数仓_1、2、3、n日留存用户明细
任务78: 78_尚硅谷_用户行为数仓_需求三:ADS层留存用户和留存比率
任务79: 79_尚硅谷_用户行为数仓_新数据准备
任务80: 80_尚硅谷_用户行为数仓_需求四:沉默用户
任务81: 81_尚硅谷_用户行为数仓_需求五:本周回流用户数
任务82: 82_尚硅谷_用户行为数仓_需求六:流失用户
任务83: 83_尚硅谷_用户行为数仓_需求七:最近连续3周活跃用户数
任务84: 84_尚硅谷_用户行为数仓_需求八:最近七天内连续三天活跃用户数
任务85: 85_尚硅谷_用户行为数仓_用户行为数仓业务总结
任务86: 86_尚硅谷_用户行为数仓_Hive企业面试题总结
任务87: 87_尚硅谷_业务数仓_业务数仓课程介绍
任务88: 88_尚硅谷_业务数仓_电商业务与数据结构简介
任务89: 89_尚硅谷_业务数仓_表的分类
任务90: 90_尚硅谷_业务数仓_同步策略
任务91: 91_尚硅谷_业务数仓_范式理论
任务92: 92_尚硅谷_业务数仓_雪花模型、星型模型和星座模型
任务93: 93_尚硅谷_业务数仓_配置Hadoop支持Snappy压缩
任务94: 94_尚硅谷_业务数仓_业务数据生成
任务95: 95_尚硅谷_业务数仓_Sqoop安装及参数
任务96: 96_尚硅谷_业务数仓_Sqoop导入数据
任务97: 97_尚硅谷_业务数仓_ODS层建表及数据导入
任务98: 98_尚硅谷_业务数仓_DWD层建表及导入数据
任务99: 99_尚硅谷_业务数仓_需求讲解
任务100: 100_尚硅谷_业务数仓_DWS层之用户行为宽表
任务101: 101_尚硅谷_业务数仓_需求九:GMV成交总额
任务102: 102_尚硅谷_业务数仓_需求十:ADS层之新增用户占日活跃用户比率
任务103: 103_尚硅谷_业务数仓_需求十一:ADS层之用户行为漏斗分析
任务104: 104_尚硅谷_业务数仓_用户购买商品明细表(宽表)
任务105: 105_尚硅谷_业务数仓_需求十二:ADS层品牌复购率
任务106: 106_尚硅谷_业务数仓_需求十三:求每个等级的用户对应的复购率前十的商品排行(学生分享)
任务107: 107_尚硅谷_业务数仓_数据可视化
任务108: 108_尚硅谷_业务数仓_Azkaban安装
任务109: 109_尚硅谷_业务数仓_GMV指标获取的全调度流程
任务110: 110_尚硅谷_业务数仓_拉链表理论
任务111: 111_尚硅谷_业务数仓_拉链表制作
任务112: 112_尚硅谷_业务数仓_业务数仓项目总结
任务113: 113_尚硅谷_业务数仓_即席数仓课程介绍
任务114: 114_尚硅谷_即席数仓_Presto简介
任务115: 115_尚硅谷_即席数仓_Presto安装及使用
任务116: 116_尚硅谷_即席数仓_Presto优化
任务117: 117_尚硅谷_即席数仓_Druid概念、特点、场景
任务118: 118_尚硅谷_即席数仓_Druid对比其他框架
任务119: 119_尚硅谷_即席数仓_Druid框架原理
任务120: 120_尚硅谷_即席数仓_Druid数据结构
任务121: 121_尚硅谷_即席数仓_Druid安装
任务122: 122_尚硅谷_面试题_总体架构
任务123: 123_尚硅谷_面试题_技术框架
任务124: 124_尚硅谷_面试题_用户行为、业务数据、即席查询
任务125: 125_尚硅谷_面试题_开发经验
任务126: 126_尚硅谷_CDH数仓_课程介绍
任务127: 127_尚硅谷_CDH数仓_CM简介及架构
任务128: 128_尚硅谷_CDH数仓_CM安装环境准备
任务129: 129_尚硅谷_CDH数仓_CM、Hadoop、Zookeeper安装
任务130: 130_尚硅谷_CDH数仓_采集Flume的安装
任务131: 131_尚硅谷_CDH数仓_Kafka安装
任务132: 132_尚硅谷_CDH数仓_测试Flume和Kafka安装
任务133: 133_尚硅谷_CDH数仓_消费Flume配置完成
任务134: 134_尚硅谷_CDH数仓_Hive、Oozie、Hue安装
任务135: 135_尚硅谷_CDH数仓_用户行为数仓ODS层导数据
任务136: 136_尚硅谷_CDH数仓_用户行为数仓完结
任务137: 137_尚硅谷_CDH数仓_业务数据生成
任务138: 138_尚硅谷_CDH数仓_业务数仓完结
任务139: 139_尚硅谷_CDH数仓_Oozie执行前准备
任务140: 140_尚硅谷_CDH数仓_Oozie任务编写及运行
任务141: 141_尚硅谷_CDH数仓_即席查询数仓搭建Impala
任务142: 142_尚硅谷_CDH数仓_Spark安装及总结
祝资源共享吧越来越火! 我想说 牛逼 风格和啊额 22222222222222222 看一看是什么东西 感谢分享 666 强大的资源共享吧,一定给你多拉人推荐!
页:
[1]
2