32. データウェアハウスとのコスト⽐較
Solution Cost/Terabyte
SAP HANA $800K - $1000K
Teradata $80K - $150K
IBM Netezza $40K - $55K
Oracle Exadata $30K - $50K
HDP $0.7K -$4K
Teradata and Hadoop Cost Component (Per TB)Teradata offload can save customers 65% - 90% of
their IT cost related to Teradata; Typical savings are
about 85%
38. グローバル事例
データ活⽤による新規ビジネスの展開
運転傾向・⾞の使⽤環境に基づ
いた柔軟な保険提案の実現
à Snapshot plug-in デバイスは
運転の詳細を収集
à Progressiveは、1000万マイル以上の
運転データを保存 (約1600万Km)
à Webアプリ経由で、顧客は⾃⾝の
運転詳細を⾒ることができ、
安全向上に努めることが可能
à Snapshotとusage-based insurance
は2014年には、Progressiveに26 億
ドルの貢献(約2730億円)
Innovate
Renovate
Claims Notes
Mining
Individual
Driving
Histories
Usage-Based
Insurance (UBI)
Web Log
Analysis
Online Ad
Placement
Sensor Data
Ingest
PREDICTIVE
ANALYTICS
A C T I V E
A R C H I V E
D A T A
D I S C O V E R
Y
D A T A
D I S C O V E R
Y
D A T A
D I S C O V E R
Y
E T L
O N B O A R D
Safe Roads
既存データの
可視化
データ拡充
新規基盤構築
新規モデル作成 新規サービス
提供
39. グローバル事例
スマートメーター活⽤による新しいマーケティング・顧客サービス
1.3 Million
Smart Meters
EDW
Offload
Mobile App for
Customer Sites
Ingest 300
GB per Day
Product
Cross-Sell
データ活⽤による新しい
電⼒提供サービス
スマートメーターによるデータ
量増加に対応した環境構築
年数回の顧客訪問(検針)
→13万個のスマートメーター
数億円のDWHコスト最適化
11時間かかっていたETL処理を
45分に削減
個客に応じた新たなサービス
⾰新的サービスを主体としたビ
ジネモデルに変⾰
Innovate
Renovate
Smart,
Efficient
Homes
D A T A
D I S C O V E R
Y
D A T A
E N R I C H M E N
T
P R E D I C T I V E
A N A L Y T I C S
S I N G L E
V I E W
A C T I V E
A R C H I V E
E T L
O N B O A R D
SINGLE
VIEW
S I N G L E
V I E W
P R E D I C T I V E
A N A L Y T I C S
On-site customer
data capture
Optimized
engineering
schedule
Tailored
servicing
Customer
sentiment
既存環境の最
適化・可視化 データ拡充
予測分析
Data Discovery
新規サービス
提供
45. 統合データレイクの構築にHortonworksを採⽤
⽇産⾃動⾞株式会社様
Data Sources Big Data Platform Data Analytics
Platform
Data Integration
Platform
ESB
MLlib
Data Sources
Data Mgmt.
Platform
Data Integration
Platform
Data Sources for Analytics
Data Analytics
Platform
Hortonworks Data Platform
LLAP
Data Mart
AMQP
ETL
à ⾛⾏データを⻑期保管するための
インフラが必要
à サイロ化している社内データの統合
à さまざまなデータをクロスファンクショナル
に活⽤するためのプラットフォームが必要
導⼊背景
サイロ化されたデータをデータレイクに統合
導⼊効果
à 社内のあらゆるデータを蓄積できる
データレイクの構築を実現
à さまざまなデータ活⽤に対するニーズが向上
à IoT データ分析や、
グローバルデータレイクの構想
46. 複数のデータソースを利⽤したデータ駆動型ビジネスの実現
à ⾃動販売機からのデータを
もとに、最適な補填納品ルート
を分析
à SAP HANAとHadoopでデータの
最適配置によるコスト最適化
à 複数データソースを集約し、
必要なビジネスレポートを⽣成
à サイトーサイト間で
リアルタイムにデータを複製
出典: https://www.slideshare.net/DamienContreras/damien-contreras-futureofdata20170428
BW on HanaHadoop Prod
Nifi
Prod
NiFi
Prod
Boomi
Hive
JDBC
Drill
IDOCS
JDBC
Flat files
MySQL
SAP ECC
Other systems
Other
systems
FTP
JDBC
HTTP HTML
interface
Power users
Acquisition Transformation Restitution
dt=20161024
dt=20161025
t_my_table_txt_p
My_file_20161024.csv
My_file_20161025.csv
Myflow-data
t_my_table_txt_p
(External text tables)
t_my_table_txt_p
t_my_bridge_table_txt_p
+Myflow-data
(Database)
t_my_report_orc_p
(ORC tables)
コカコーラ・イーストジャパン株式会社様
Picking list
Visit Plan
Online VM
Offline VM
Every day
Yes NoNoArbitration
Forecast
generation