書(shū)單推薦 新書(shū)推薦 |
Spark大數(shù)據(jù)處理與分析
本教材重點(diǎn)介紹了Linux集群環(huán)境的完全分布式環(huán)境搭建、SparkCore(RDD)、SparkSQL數(shù)據(jù)處理編程(DataFrame)、SparkStreaming編程模型(LegacyDStream)、StructuredStreaming編程模型、SparkMLlib(DataFrame-based、RDD-based),以幫助學(xué)生初步掌握大數(shù)據(jù)平臺(tái)的數(shù)據(jù)接入、處理、分析和挖掘工作,理解Spark生態(tài)的大數(shù)據(jù)離線/實(shí)時(shí)處理平臺(tái)的設(shè)計(jì)、開(kāi)發(fā)及持續(xù)優(yōu)化和數(shù)據(jù)模型的建立、設(shè)計(jì)與算法實(shí)現(xiàn),以及模型效果的追蹤、檢驗(yàn)及優(yōu)化。
你還可能感興趣
我要評(píng)論
|