大數(shù)據(jù)整體體解決方案、架構(gòu)介紹、流處理、批處理
硬件選型,操作系統(tǒng)選型
開(kāi)源軟件,Hadoop生態(tài)軟件
大數(shù)據(jù)組件(開(kāi)發(fā)語(yǔ)言介紹)
Cloudera CDH安裝及集群介紹
Cloudera CDH 安裝
Hadoop集群介紹,Hadoop集群使用
HDFS分布式文件系統(tǒng)介紹
Kafka的使用場(chǎng)景
Kakfa的設(shè)計(jì)思想,Kafka文件存儲(chǔ)機(jī)制
持久化\負(fù)載均衡\Topic模型
消息傳輸一致性\分布式
Leader的選擇\集群分區(qū)
生產(chǎn)者消費(fèi)者配置
案例:Kafka從flume獲取消息,實(shí)現(xiàn)傳輸
flume+sqoop介紹及開(kāi)發(fā)實(shí)例
flume實(shí)現(xiàn)數(shù)據(jù)采集流程
flume agent配置,flume sink配置,flume 數(shù)據(jù)過(guò)濾
案例(1): 使用flume動(dòng)態(tài)采集日志
Sqoop功能及軟件結(jié)構(gòu)
從關(guān)系型數(shù)據(jù)庫(kù)導(dǎo)入數(shù)據(jù)到HDFS,從HDFS導(dǎo)入數(shù)據(jù)到關(guān)系型數(shù)據(jù)庫(kù)