爽死你个放荡粗暴婬货_亚洲v?高清中文字幕_玉女福利视频导航_91香蕉视频在线_久久精品无码一区二区三区毛片_三级片自拍视频_在线观看网站人成亚洲小说_国产精品亚洲欧美综合网站_日本a级作爱片口爱_2021国产剧情a在线

課程

課程介紹

本課程對(duì)Spark的不同版本源碼徹底研究基礎(chǔ)之上提煉而成,涵蓋Spark所有內(nèi)核精髓的剖析和大量的核心源碼解讀,帶您深入了解Spark內(nèi)核機(jī)制和核心優(yōu)化技巧,商業(yè)級(jí)別Spark項(xiàng)目的架構(gòu)設(shè)計(jì)、實(shí)現(xiàn)和優(yōu)化。并通過(guò)商業(yè)實(shí)戰(zhàn)案例真正了解Spark的規(guī)劃、部署、開(kāi)發(fā)和管理技術(shù)。

培訓(xùn)對(duì)象

云計(jì)算大數(shù)據(jù)從業(yè)者;
Hadoop使用者;
系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開(kāi)發(fā)人員;
牽涉到大數(shù)據(jù)處理的數(shù)據(jù)中心運(yùn)行、規(guī)劃、設(shè)計(jì)負(fù)責(zé)人;
政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)和互聯(lián)網(wǎng)等大數(shù)據(jù)來(lái)源單位的負(fù)責(zé)人;
高校、科研院所涉及到大數(shù)據(jù)與分布式數(shù)據(jù)處理的項(xiàng)目負(fù)責(zé)人;
數(shù)據(jù)倉(cāng)庫(kù)管理人員、建模人員,分析和開(kāi)發(fā)人員、系統(tǒng)管理人員、數(shù)據(jù)庫(kù)管理及對(duì)數(shù)據(jù)倉(cāng)庫(kù)感興趣的其他人員。

課程收益

了解Spark內(nèi)核機(jī)制和核心優(yōu)化技巧;
實(shí)現(xiàn)商業(yè)級(jí)別Spark想的架構(gòu)設(shè)計(jì);
通過(guò)案例了解Spark的規(guī)劃和部署。

知識(shí)概要

-- Spark生態(tài)介紹;
-- Spark安裝部署;
-- Spark運(yùn)行架構(gòu)和解析;
-- Sparkscala編程;
-- Spark編程模型和解析;
-- Spark 數(shù)據(jù)挖掘;
-- Spark Streaming原理和實(shí)踐;
-- Spark的優(yōu)化;
-- Spark的數(shù)據(jù)源;
-- Spark Streaming應(yīng)用及案例分析;
-- 典型項(xiàng)目案例實(shí)戰(zhàn)。

課程大綱

模塊

學(xué)習(xí)內(nèi)容

第一天AM

Spark生態(tài)介紹

Mapreduce、storm和spark模型的比較和使用場(chǎng)景介紹

Spark產(chǎn)生背景

Spark(內(nèi)存計(jì)算框架)

SparkSteaming(流式計(jì)算框架)

Spark SQL(ad-hoc)

Mllib(MachineLearning)

GraphX(bagel將被代)

DlinkDB介紹

SparkR介紹

Spark安裝部署

Spark安裝簡(jiǎn)介

Spark的源碼編譯

Spark Standalone安裝

Spark應(yīng)用程序部署工具spark-submit

Spark的高可用性部署

第一天PM

Spark運(yùn)行架構(gòu)和解析

Spark的運(yùn)行架構(gòu)

基本術(shù)語(yǔ)

Spark on Standalone運(yùn)行過(guò)程

Spark on YARN 運(yùn)行過(guò)程

Spark運(yùn)行實(shí)例解析

Spark on Standalone實(shí)例解析

Spark on YARN實(shí)例解析

比較 Standalone與YARN模式下的優(yōu)缺點(diǎn)

Spark scala編程

Scala基本語(yǔ)法與高階語(yǔ)法

Scala開(kāi)發(fā)環(huán)境搭建

Scala開(kāi)發(fā)Spark應(yīng)用程序

使用java編程

使用python編程

第二天AM

Spark編程模型和解析

Spark的編程模型

Spark編程模型解析

RDD的特點(diǎn)、操作、依賴關(guān)系

Spark應(yīng)用程序的配置

Spark的架構(gòu)

spark的容錯(cuò)機(jī)制

數(shù)據(jù)的本地性

緩存策略介紹

寬依賴與窄依賴

Spark 數(shù)據(jù)挖掘

Mllib的介紹

graphX核心原理

table operator和graph operator區(qū)別

vertices、edges和triplets介紹

構(gòu)建一個(gè)graph

SparkR原理

SparkR實(shí)戰(zhàn)

第二天PM

Spark Streaming原理和實(shí)踐

Spark Streaming與Strom的區(qū)別

Kafka的部署

Kafka與Spark Streaming的整合

Spark Streaming原理

Spark流式處理架構(gòu)

DStream的特點(diǎn)

Dstream的操作和RDD的區(qū)別

帶狀態(tài)的transformation與無(wú)狀態(tài)transformation

Spark Streaming的優(yōu)化

Spark Streaming實(shí)例

Streaming的容錯(cuò)機(jī)制

streaming在yarn模式下的注意事項(xiàng)

對(duì)于需結(jié)合第三方存儲(chǔ)機(jī)制的與流式處理方案

文本實(shí)例

網(wǎng)絡(luò)數(shù)據(jù)處理

Kafka+Spark Streaming實(shí)現(xiàn)日志的實(shí)時(shí)分析案例

第三天AM

Spark的優(yōu)化

序列化優(yōu)化 — Kryo

Spark參數(shù)優(yōu)化實(shí)戰(zhàn)

Spark 任務(wù)的均勻分布策略

Partition key傾斜的解決方案

Spark任務(wù)的監(jiān)控

GC的優(yōu)化

Spark Streaming吞吐量?jī)?yōu)化

Spark RDD使用內(nèi)存的優(yōu)化策略

Spark在使用中的感想分享

Spark的數(shù)據(jù)源

Spark與HDFS的整合

HDFS RDD原理和實(shí)現(xiàn)

Spark與Hbase的整合

Spark與Cassendera整合

Hbase RDD的分區(qū)讀取

Hbase RDD的原理和實(shí)現(xiàn)

Spark parallelism RDD的工作機(jī)制

第三天PM

Spark Streaming應(yīng)用及案例分析

Spark Streaming產(chǎn)生動(dòng)機(jī)

Spark Streaming程序設(shè)計(jì)

1)創(chuàng)建DStream

2)基于DStream進(jìn)行流式處理

Spark Streaming容錯(cuò)與性能優(yōu)化

1)Spark Streaming容錯(cuò)機(jī)制

2)如何對(duì)spark Streaming進(jìn)行優(yōu)化

Spark Streaming案例分析

基于Spark Streaming的用戶標(biāo)簽系統(tǒng),內(nèi)容包括項(xiàng)目背景,項(xiàng)目架構(gòu)以及實(shí)施方法

典型項(xiàng)目案例實(shí)戰(zhàn)

基于spark日志分析

個(gè)性化推薦系統(tǒng):帶你揭開(kāi)其神秘面紗

在線投放引擎

揭開(kāi)淘寶點(diǎn)擊推薦系統(tǒng)的神秘面紗

淘寶數(shù)據(jù)服務(wù)架構(gòu)—實(shí)時(shí)計(jì)算平臺(tái)

認(rèn)證過(guò)程

無(wú)認(rèn)證考試

開(kāi)班信息

暫無(wú)開(kāi)班信息

相關(guān)課程