指導(dǎo)性架構(gòu)與其目標(biāo)
NIST 大數(shù)據(jù)參考架構(gòu)的主要特點(diǎn)
整體結(jié)構(gòu)(5 個(gè)邏輯角色和2個(gè)維度)
角色名稱(chēng)
維度名稱(chēng)
信息如何在不同角色之間流動(dòng)
Hadoop 架構(gòu)下核心組件的名稱(chēng)
NameNode – 名字節(jié)點(diǎn)
MapReduce – 映射歸約
SlaveNode - 從屬節(jié)點(diǎn)
Job tracker – 工作跟蹤器
HDFS - 分布式文件系統(tǒng)
使用大數(shù)據(jù)參考架構(gòu)的收益
與參考架構(gòu)中的邏輯角色相關(guān)聯(lián)的職能和活動(dòng)
System Orchestrator - 系統(tǒng)編配器
Data Provider - 數(shù)據(jù)提供者
Big Data Application Provider - 大數(shù)據(jù)應(yīng)用提供者
Big Data Framework Provider - 大數(shù)據(jù)框架提供者
Data Consumer - 數(shù)據(jù)消費(fèi)者
本地式處理和分布式存儲(chǔ)處理的區(qū)別
面對(duì)海量數(shù)據(jù)的三種大數(shù)據(jù)存儲(chǔ)系統(tǒng)
Direct Attached Storage (DAS)- 直接附加存儲(chǔ)
Network Attached Storage (NAS) - 網(wǎng)絡(luò)附加存儲(chǔ)
Storage Area Network (SAN) - 存儲(chǔ)區(qū)域網(wǎng)絡(luò)
大數(shù)據(jù)存儲(chǔ)機(jī)制
File systems - 文件系統(tǒng)
NoSQL databases - NoSQL 數(shù)據(jù)庫(kù)
Parallel programming models - 并行編程模型
大數(shù)據(jù)實(shí)證分析體系結(jié)構(gòu)
Real time analysis- 實(shí)時(shí)分析
Off-line analysis - 離線(xiàn)分析
Hadoop 在大數(shù)據(jù)環(huán)境中的功能
以下 Hadoop 組件的角色
NameNode – 名字節(jié)點(diǎn)
MapReduce – 映射歸約
SlaveNode - 從屬節(jié)點(diǎn)
Job tracker – 工作跟蹤器
HDFS – 分布式文件系統(tǒng)