10. Microsoft のビッグデータ分析基盤の全体像
ビッグデータ分析基盤Power BI
機械学習
Business
Intelligence
大規模データ分析
(Hadoop)
データマイニング
Power Map Power View
PowerPivot
Power Q&A
Power Query
ビッグデータ分析で必要となる
すべてのデータ分析機能を提供
全社員が使い慣れたツールを使って
自分自身でデータを活用可能
情報共有(ポータル)
データストア(RDB・File ... etc.)
11. Demo
Power BI for Office 365
IT とビジネス
現場の橋渡しを
行う役割
生データ
Power Query
現場が活用できるデータ
現場社員現場社員による活用
Power View
Power Pivot
Power Pivot ファイルをSharePoint で共有
Power Map
Data Mining Power Q&A
18. Next Session ...
本セッションでお伝えできなかったの部分は、B32 のセッションをお聞きください。
ビッグデータ分析基盤Power BI
データマイニング
機械学習
Business
Intelligence
大規模データ分析
Power Map Power View
(Hadoop) PowerPivot
Power Q&A
Power Query
ビッグデータ分析で必要となる
すべてのデータ分析機能を提供
全社員が使い慣れたツールを使って
自分自身でデータを活用可能
情報共有(ポータル)
データストア(RDB・File ... etc.)
19. 今すぐお試しください!
Step1
Step2 最新Excelが
含まれます
Office 365 Enterprise
Q&A
Power BI
サイト
Excel
アドイン
www.office365.com Powerbi.com
20. 関連サイト
Power BI for Office 365 紹介ビデオ
http://aka.ms/pbidemo
Power BI 紹介サイト
http://www.microsoft.com/ja-jp/
sqlserver/2012/powerbi/
まずMicrosoft のビッグデータ分析基盤の全体像をご紹介します。
ビッグデータ分析基盤
ビッグデータというキーワードが世の中で一般的に使われるようになって久しいが、ビッグデータを分析するための手法は主に4つに集約される。
数値データを集計ベースで分析するためのBusiness Intelligence
超大容量の数値データや、文字列データなどの非定型データを複数のサーバで分散処理させて分析するHadoop
人間がなかなか気づきにくいデータ間の相関関係やルールなどを、様々な統計的アルゴリズムを使って導き出すデータマイニング
データマイニングと同じ様な手法を使い、モールに来たお客様が買いそうな商品を予測したり、お客様の属性情報を予測する、「未知の情報を予測する」ための機械学習」
マイクロソフトでは、これらビッグデータで必要となる全ての分析手法を実現するための基盤を提供している
Power BI
これらの分析基盤にアクセスする方法として、Power BIというブランドで分析のクライアント機能を提供しており、このPower BIを使う事によって、ビッグデータ分析基盤につなぎ、非常に簡単な操作でビッグデータの分析を行う事ができる様になります。
http://blogs.msdn.com/b/powerbi/archive/2014/05/08/describing-the-forecasting-models-in-power-view.aspx
https://support.office.com/en-us/article/Forecast-your-data-in-Power-View-in-HTML5-and-the-Power-BI-app-5F61CE35-A6B3-4969-AA7D-9D259609D16D
Holt-Winters アルゴリズムをもとにエンハンスを追加
Use of validation window for optimal parameter selection
State vector correction at the end of training window when data is noisy
データポイント全体の40%未満の欠損値は線形に補完する。
タイムシリーズ
ARTXP:短期的なモデル作成に向く (SQL Server 2005 で導入されたアルゴリズム)
ARIMA:長期的なモデル作成に向く (SQL Server 2008 で導入されたアルゴリズム)
The confidence interval shows visually how reliable the forecast is. Standard deviation is the setting for the confidence interval of forecast results.
信頼区間は、予測の信頼性を視覚的に表します。標準偏差は、予測結果の信頼区間を設定するものです。
It is important to understand that in Power View hindcasts are based only on the portion of the data preceding your selection, and not on the complete data. This can affect the quality of the predictions in several ways:
Hindcasts will not necessarily mirror predictions based on the larger data set, simply because the data is different.
The farther you go back in time, the less information you have, and the less it will represent your current forecast.
If there have been any significant changes in the distribution of values throughout your historical data, you should take those into account when assessing the quality of the hindcasts.
<アニメーション 上段 Hindcast>
① Hindcast の説明
② 予測を行うと、左側に引っ張れる点 (<・)が表示されるので、左にドラッグ
③ Hindcast エリアには予測した線と実際の値が表示される
<アニメーション 下段 what-if analysis>
① 2010年1月の値を上方に修正 (上にドラッグ)
② 青い線の値を元に予測し直される。信頼区間 (青の網掛) も幅が狭くなっていることが確認できる
次は「課題2」