课程简介:
这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cou和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存数据,也需要面对高成本的问题,因为具有海量数据容量的存储设备,价格往往也是天文数字。成本和IT能力成为了海量数据分析的主要瓶颈。 课程讲师:tigerfish 讲师介绍:
tigerfish,ITPUB创始人,中山大学海量数据与云计算研究中心主任。数据库专家,数据分析专家,有丰富的IT领域、数学领域的知识经验。他将带领他的数据分析团队完成整个授课工作。 授课对象:
具有linux操作一般知识(因为hadoop在linux下跑),对Java有一小点认识,对Hadoop及其子系统有兴趣的IT人或学习者 打包下载课程目录第1课 Hadoop的源起与体系介绍
第2课 实施Hadoop 1.x和2.x集群,基于win的部署
第3课 分布式文件系统HDFS原理与操作,HDFS API编程
第4课 2.x下HDFS新特性,高可用,联邦,快照
第5课 Map-Reduce原理、体系架构和工作机制,Hadoop流,M-R编程实战,eclipse与Hadoop集群连接
第6课 Map-Reduce复杂应用案例
第7课 新一代计算框架YARN
第8课 Pig安装与Pig Latin语言,应用案例
第9课 Hive体系架构、安装与HiveQL,应用案例
第10课 数据挖掘神器Mahout
第11课 HBase与Zookeeper体系架构
第12课 HBase集群安装,管理
第13课 HBase数据模型,实战案例建模剖析
第14课 数据集成Sqoop,Flume,Chukwa,商业数据库和Hadoop集群的连接
第15课 与应用连接,REST和Thrift接口,UDF实战,RHadoop
第16课 进军Hadoop源代码
第17课 企业级集群实施,Hadoop在互联网企业中的应用案例
|