More Related Content
Similar to データ分析を支える技術 DWH再入門 (20)
More from Satoru Ishikawa (11)
データ分析を支える技術 DWH再入門
- 2. 2⾃⼰紹介
• ⽒名
- ⽯川 覚 (いしかわ さとる)
• 所属
- データアナリティクス事業本部 (DA事業本部)
- インテグレーション部
- 札幌オフィス勤務
• 略歴
- メーカー系SIer、ITベンチャー企業、現在に⾄る
• 担当業務
- データ分析基盤の設計・開発、コンサルティング
• 好きなサービス
- Amazon Redshift/Athena、Snowflake 、Google BigQuery
2020 APN AWS Top Engineers 選出
- 16. 16DWHの特性
2. サブジェクト指向(subject oriented)
• 「商品」や「顧客」のように分析の軸(次元)ごとに集計し
て蓄積したデータである「データマート」を作成する
• 複数ディメンジョンのデータマート︓データ探索⽤途
• 単⼀ディメンジョンのデータマート︓パフォーマンス重
視のためダッシュボード⽤途
※グラニュラリティ(要約の粒度)は要件やデータの規模に
よって調整する
- 44. 44相違点
データアクセスの⽐較
特性 オンライントランザクション処理
(OLTP: OnLine Transaction Processing)
オンライン分析処理
(OLAP: OnLine Analytic Processing)
データの規模 数GBから数TB 数百GBから数PB
読み込みの
パターン
インデックスのキーを⽤いた少数
のレコードの低レイテンシ読み込
み
⼤量のレコード中の少数の列だ
けを読み込み
書き込みの
パターン
ランダムアクセスと低レイテンシ
書き込み
レコード中の更新した列の追加
書き込み、もしくは⼤量データ
の⼀括インポート