第1天: hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示
01-hadoop职位需求状况
02-hadoop课程安排
03-hadoop应用场景
04-hadoop对海量数据处理的解决思路
05-hadoop版本选择和伪分布式安装
06-hadoop版本选择和伪分布式安装2
07-hdfs&mapreduce测试
08-hdfs的实现机制初始
09-hdfs的shell操作
10-hadoop集群搭建的无密登陆配置
第2天:hdfs的原理和使用操作、编程
01-NN元数据管理机制
02-NN工作机制2
03-DN工作原理
04-HDFS的JAVA客户端编写
05-filesystem设计思想总结
06-hadoop中的RPC框架实现机制
07-hadoop中的RPC应用实例demo
08-hdfs下载数据源码跟踪铺垫
09-hdfs下载数据源码分析-getFileSystem
10-hdfs下载数据源码分析-getFileSystem2
第3天: mapreduce的原理和编程
01-hdfs源码跟踪之打开输入流
02-hdfs源码跟踪之打开输入流总结
03-mapreduce介绍及wordcount
04-wordcount的编写和提交集群运行
05-mr程序的本地运行模式
06-job提交的逻辑及YARN框架的技术机制
07-MR程序的几种提交运行模式
08-YARN的通用性意义
09-yarn的job提交流程
第4天:常见mr算法实现和shuffle的机制
01-复习
02-hadoop中的序列化机制
03-流量求和mr程序开发(可能是加密过的文件,请核实)
04-hadoop的自定义排序实现
05-mr程序中自定义分组的实现
06-shuffle机制
07-mr程序的组件全貌
08-textinputformat对切片规划的源码分析
09-倒排索引的mr实现
10-多个job在同一个main方法中提交
第5天:hadoop2.x中HA机制的原理和全分布式集群安装部署及维护
01-zookeeper
02-zookeeper2
03-NN高可用方案的要点1
04-hadoop-HA机制的配置文件
05-hadoop分布式集群HA模式部署
06-hdfs--HA测试
07-hdfs--动态增加节点和副本数量管理
08-HA的java api访问要点
09-hive入门
第6天:hbase hive
01-复习ha相关
02-hive的元数据库mysql方式安装配置
03-hive的使用
04-hive的常用语法
05-hql语法及自定义函数
06-hbase表结构
07-hbase集群架构及表存储机制
08-hbase-shell
09-hbase的java api
第7天:storm+kafka
01-storm基本概念
02-storm编程规范及demo编写
03-storm的topology提交执行
04-kafka介绍
05-kafuka集群部署及客户端编程
006-kafka整合storm
06-kafka消费者java客户端编程
第8天:实战项目《电信运营商流量经营系统》
01-项目背景及技术架构
02-主要技术选型
03-flume介绍及演示
04-行为轨迹增强处理流程
05-样本url筛选模块开发
06-行为轨迹增强模块1
07-行为轨迹增强模块2
01-项目背景及技术架构
页:
[1]
2