面對日新月異的大數據工具,有時候很難跟上這節奏。有鑑於此,Amazon Web Services提供了廣泛而完善的雲端運算服務組合,幫助您構建、維護和部署大數據應用程式。
這場線上研討會,將為各位深入淺出介紹AWS 雲端平台提供的各種大數據選項,包括現正流行的大數據框架,如Hadoop、Spark、NoSQL數據庫等,同時透過使用案例來瞭解最佳實踐方式。最後,您將了解如何應用這些工具服務,將大數據導入您的現實應用程式中。
3. §Build an entire analytics application to power your business
§Scale Hadoop cluster to thousands of instances in minutes
§Leverage powerful AWS compute instances using Intel technology
Big Data Spotlight: Analytics
7. GB
TB
PB
ZB
EB
大數據: 沒有成長的限制
• 非結構化資料呈現爆炸
性的成長
• 數位匯流 1.2 ZB 資料
中,95% 的資料是非結
構化的
• 來自機器的資料與物聯
網會讓這曲線更顯著
• 70% 的資料由用戶產生
Source: IDC, The Internet of Things: Getting Ready to Embrace Its Impact on the Digital Economy, March 2016.
8. 為何建立大數據解決方案?
Security threat detection
User Behavior Analysis
Smart Application (Machine Learning)
Business Intelligence
Fraud detection
Financial Modeling and Forecasting
Spending optimization
Real-time alerting
更快獲得答案而且可以找出目前未發現的問題
23. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
AWS Cloudcorporate data center
Migrate your data to AWS
AWS Database
Migration Service
AWS Direct Connect
AWS Import/Export
& Snowball
28. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
AWS Cloudcorporate data center
使用 Amazon QuickSight 視覺化你的資料
AWS Database
Migration Service
AWS Direct Connect
AWS Import/Export
& Snowball
33. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
AWS Cloud
使用 AWS Lambda 進行事件導向的資料轉換
corporate data center
AWS Lambda
Structured Data
In Amazon S3
Raw data
In Amazon S3
38. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
AWS Cloud
使用Amazon EMR大規模轉換和探索數據
corporate data center
Amazon EMR Structured Data
In Amazon S3
Raw data
In Amazon S3
41. 建立大數據應用程式
使用 Amazon Athena 將您的資料倉儲擴展到 S3
web clients
mobile clients
DBMS
Raw data
In Amazon S3
Amazon Redshift
Staging Data
In Amazon S3
Amazon
QuickSight
AWS Cloudcorporate data center
Amazon
EMR
Amazon
Athena
42. 建立大數據應用程式
使用 Amazon Athena 將您的資料倉儲擴展到 S3
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
AWS Cloudcorporate data center
Amazon
EMR
Orc/Parquet in Amazon S3
(Columnar Data Format)
Amazon
EMR
Raw data
In Amazon S3
Staging Data
In Amazon S3
Amazon
Athena
44. 建立大數據應用程式
在 Amazon EMR 上使用 Presto, Spark SQL 等, 將您的資料倉儲擴展到 S3
web clients
mobile clients
DBMS
Amazon Redshift
Orc/Parquet in Amazon S3
(Columnar Data Format)
Amazon
QuickSight
AWS Cloudcorporate data center
Amazon
EMR
Amazon
EMR
Amazon
EMR
Raw data
In Amazon S3
Staging Data
In Amazon S3
48. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Orc/Parquet
(Columnar Data Format)
Amazon
QuickSight
Amazon Kinesis
Streams
AWS Cloud
使用 Amazon Kinesis 加上 Spark on Amazon EMR 建立即時資料層
corporate data center
Amazon
EMR
Amazon
EMR
Amazon
EMR
Raw data
In Amazon S3
Staging Data
In Amazon S3
Amazon
Athena
49. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
AWS Cloud
使用 Amazon Kinesis Analytics 與 AWS Lambda 響應即時資料
corporate data center
Amazon Kinesis
Firehose
Amazon Kinesis
Analytics
AWS Lambda
Amazon
Kinesis
Streams
Amazon SNS
Reference data
in Amazon S3
Amazon
Athena
50. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
AWS Cloud
使用 Amazon Machine Learning 智能的響應即時資料
corporate data center
Amazon Kinesis
Firehose
Amazon Kinesis
Analytics
AWS Lambda
Amazon
Kinesis
Streams
Reference data
in Amazon S3
Amazon
Machine
Learning
Amazon SNS
Amazon
Athena
52. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
Amazon Kinesis
Streams
AWS Cloud
使用 AWS KMS 進行資料存放時加密
corporate data center
AWSKMS
Amazon
EMR
Amazon
EMR
Raw data in S3 Staging Data in S3
Orc/Parquet in Amazon S3
(Columnar data)
53. 建立大數據應用程式
web clients
mobile clients
DBMS
Amazon Redshift
Amazon
QuickSight
Amazon Kinesis
Streams
AWS Cloud
AWSKMS
VPC subnet
SSL/TLS
SSL/TLS
資料傳輸保護與網路隔離
corporate data center
Raw data in S3 Staging Data in S3
Orc/Parquet in Amazon S3
(Columnar data)