Big Data on AWS課程將向您介紹基于云的大數(shù)據(jù)解決方案,例如Amazon Elastic MapReduce(EMR)、Amazon Redshift、Amazon Kinesis和其余AWS大數(shù)據(jù)平臺。在本課程中,我們將向您介紹如何使用Amazon EMR來利用諸如Hive和Hue等廣泛Hadoop工具體系處理數(shù)據(jù)。講授內(nèi)容還包括如何創(chuàng)建大數(shù)據(jù)環(huán)境、使用Amazon DynamoDB、Amazon Redshift和Amazon Kinesis,利用較佳實踐來設(shè)計大數(shù)據(jù)環(huán)境,從而實現(xiàn)安全性和經(jīng)濟(jì)性。
我們建議參加學(xué)習(xí)本課程的人員符合以下先決條件:
基本熟悉大數(shù)據(jù)技術(shù),包括Apache Hadoop、MapReduce、HDFS和SQL/NoSQL查詢
學(xué)員應(yīng)完成Big Data Technology Fundamentals網(wǎng)絡(luò)培訓(xùn)或具備同等經(jīng)驗
具有核心AWS服務(wù)和公有云實施工作經(jīng)驗
學(xué)員應(yīng)完成AWS Technical Essentials課程或具備同等經(jīng)驗
了解數(shù)據(jù)倉庫、關(guān)系數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫設(shè)計基礎(chǔ)
本課程中您將學(xué)習(xí):
適用大數(shù)據(jù)體系內(nèi)的AWS解決方案
在Amazon EMR環(huán)境中使用Apache Hadoop
確定Amazon EMR集群的組件
啟動并配置Amazon EMR集群
利用Amazon EMR的常用編程框架,包括Hive、Pig和Streaming
利用Hue提高Amazon EMR的易用性
在Amazon EMR上搭配使用內(nèi)存分析及Spark和Spark SQL
選擇適當(dāng)?shù)腁WS數(shù)據(jù)存儲選項
確定使用Amazon Kinesis以近乎實時的速度處理大數(shù)據(jù)的優(yōu)勢
定義數(shù)據(jù)倉庫和列式數(shù)據(jù)庫的概念
利用Amazon Redshift有效地存儲和分析數(shù)據(jù)
了解和管理Amazon EMR及Amazon Redshift部署的成本和安全性
確定用于獲取、傳輸和壓縮數(shù)據(jù)的選項
使用可視化軟件描述數(shù)據(jù)和查詢
利用AWS Data Pipeline編排大數(shù)據(jù)工作流目標(biāo)人群