SlideShare a Scribd company logo
1 of 34
Download to read offline
Copyright © K.K. Ashisuto
データの分析や解析の前に必要となる「データ準備」とは。
データ・プレパレーション・プラットフォーム『Paxata』
2017年9月6日
株式会社アシスト
情報基盤技術統括部 技術2部 山口晃司
Copyright © K.K. Ashisuto
講師紹介
2
山口 晃司
株式会社アシスト
情報基盤技術統括部 技術2部
アシスト入社後、BI製品のサポート、フィールド業務を経て、2016年よりデータ・
プレパレーション・プラットフォーム「Paxata」の製品技術として顧客への提案、導入、
開発支援を担当。
Copyright © K.K. Ashisuto
アシストについて
設立 1972年3月
代表取締役会長 ビル・トッテン
代表取締役社長 大塚 辰男
資本金 6,000万円
売上高 262億円(2016年度)
社員数 1,075名(2017年4月) ※グループ会社含む
事業内容
コンピュータ用パッケージ・ソフト
ウェアの販売、技術サポート、教育
およびコンサルティング
本社所在地
東京都千代田区九段北4-2-1
市ヶ谷東急ビル
オフィス所在地
札幌、仙台、名古屋、金沢、大阪、
広島、宇部、福岡、沖縄
取引会社数 6,000社(2016年度)
主要取扱製品数 60製品 (2017年4月現在)
グループ会社
株式会社アシスト北海道
株式会社のれん
※サポートセンターのみ
金沢
札幌
仙台
東京本社
名古屋
宇部
福岡
広島 大阪
沖縄
※グループ会社:㈱アシスト北海道 併設
サポート
センター
※グループ会社:
㈱のれん 併設
3
本日のテーマ
Copyright © K.K. Ashisuto
データ・プレパレーション
Copyright © K.K. Ashisuto
E
T
L
データマネジメントが困難な時代に
セントラル
ウェアハウス
データマート
クラウドシステム
ローカルファイル
エンタープライズBIIT部門の
管理範囲
セルフサービスBI
データレイク
IoT
予測分析
オープンデータ
第三者データ
業務
システム
AI・機械学習
センサー
データ
IoT
IoT
データウェアハウス
既存の仕組みだけでは、
データドリブン経営は実現できない?!
Copyright © K.K. Ashisuto
「データ」と「情報」の違い
情報データ
完成されており
クリーンで
意味付けがあって
すぐに活用できる
CRM
企業情報
会計データ
ソーシャル
メディア ERP
マシン
データ
「データ」を「情報」に変える難しさ
ユーザ部門はITツールが
つかいこなせない
IT部門はデータの意味が
わからない
データ準備に全作業の 80% が費やされている
手作業やコーディングへの依存
IT部門だけが利用可能なテクノロジー
Copyright © K.K. Ashisuto 9
データ・プレパレーションとは?
企業内外に存在するデータを
IT部門だけでなく、ユーザ部門自らが
消費可能な情報に加工・変換すること
Copyright © K.K. Ashisuto
Paxata, Inc.
Paxata 社はデータドリブン経営を実現するデータプレパレーションプラットフォームの提供を
目指して製品の開発を行っています。
• 2012年にカリフォルニアで設立
• 2013年11月に製品版をリリース
• 現在のユーザ数は100社以上
幅広い業種で100社以上の採用
10
Copyright © K.K. Ashisuto
データ・プレパレーションの業界リーダーに選出
11
3つの特長:革新的な技術の活用
人工知能
機械学習
コンシューマー
エクスペリエンス
分散
コンピューティング
機械学習を利用し
テーブル間の
結合キーを自動で判別
ノンプログラミングで
データ加工が
進められるUI
Apache Sparkを
データ加工の
エンジンに採用
Copyright © K.K. Ashisuto
Paxata システムイメージ
データレイク
エンタープライズ
ローカル
探索
整形
データ
追加
発行
整備
変更
強化
統合
デ
ー
タ
セ
ッ
ト
格
納
メ
モ
リ
展
開
ア
ン
サ
ー
セ
ッ
ト
格
納
デ
ー
タ
エ
ク
ス
ポ
ー
ト
データ
エンジニア データ
サイエンティスト
AI
機械学習 BI
ディベロッパー
BI
パワーユーザ BI
コンシューマー
HDFS
13
Copyright © K.K. Ashisuto
デモンストレーション
Copyright © K.K. Ashisuto
デモシナリオ
15
HDFS
Webキャンペーン
ログデータ
リード情報
(顧客マスタ)
データソース
HDFS
データ
追加
探索
整備
変更
整形 統合 強化
要件
ユーザ自身でWebキャンペーンのデータに顧客情報
を連携させたデータを作成し、BIツールで分析したい
+
Copyright © K.K. Ashisuto
アーキテクチャ
Copyright © K.K. Ashisuto
アーキテクチャ
Apache Sparkをエンジンに独自開発された
データ加工を行うインメモリ分散処理エンジン
分散処理の技術を取り入れたスケーラブルな構成が可能
Visually Dynamic
Multi-User Interface
HTML5を使用したユーザインターフェース
Javaで開発されたWeb Service
加工前のデータセットと加工後に出力された
Answersetを格納するためのHDFS
Data Prep Application
Web Services
Parallel In-Memory
Pipelined Data Prep Engine
Powered by Intellifusion
Distributed Processing Engine
Data Management in
Hadoop Distributed File System
Paxataは以下の4構造でシステムを構成
Copyright © K.K. Ashisuto
サーバの構成と役割
Core Server
Worker
DataNode
RDBMS
ストレージ
S3/HDFS/SFTP
クライアントPC
Pipeline
Master
NameNode
ユーザ要求の分散処理
インポートもしくは
Paxataで生成されたデータの格納先
データのインポート/エクスポート処理
UIや加工処理の要求を生成
Copyright © K.K. Ashisuto
データのインポート
Core Server
Worker
DataNode
JDBC
HTTP/HTTPS
Connector
parquet
データ
変換
Pipeline
Master
NameNode
XLSX/CSV
JSON/XML
Table
/View
XLSX/CSV
JSON/XML
parquet
RDBMS
ストレージ
S3/HDFS/SFTP
クライアントPC
DATA
→parquet
Paxataで使用するデータを登録
データ単位で利用可能なユーザを制限し共有
することが可能
インポートする
データを選択
Copyright © K.K. Ashisuto
プロジェクト作成
Core Server Pipeline
WorkerMaster
NameNode DataNode
parquet
parquet
cache
データ
変換
画面
生成
RDBMS
ストレージ
S3/HDFS/SFTP
クライアントPC DATA
DATA
parquet
→DATA
ブラウザ上のGUI操作でSparkへデータ加工
処理のリクエストを送信
加工結果をリアルタイムに参照しながら処理を
進めることができる
分散処理
データセットを
選択
Copyright © K.K. Ashisuto
AnswerSet出力
Core Server
Worker
DataNode
parquet
parquet
cache
cache
cache
データ
変換
Pipeline
Master
NameNode
RDBMS
ストレージ
S3/HDFS/SFTP
クライアントPC
DATA
DATA
→parquet
parquet
Paxata上で生成されたデータを
AnswerSetとしてHDFSへ出力し、
新たなデータを作成可能
分散処理
AnswerSetを
Publish
Copyright © K.K. Ashisuto
データのエクスポート
Core Server
Worker
DataNode
JDBC
HTTP/HTTPS
Connector
parquet
データ
変換
Pipeline
Master
NameNode
Table
XLSX/CSV
JSON/XML
parquet
parquet
cache
cache
cache
parquet
RDBMS
ストレージ
S3/HDFS/SFTP
クライアントPC
parquet
→DATA
ユーザは生成したデータを管理された
任意の出力先へエクスポートしテーブルや
ファイルとして参照することが可能
エクスポート
するデータを選択
XLSX/CSV
JSON/XML
Copyright © K.K. Ashisuto
実際のサーバ構成では、、、
Core Server
Worker
DataNode
Pipeline
Master
NameNode
(YARN)
Hadoop Distribution
Cloudera/Hortonworks/MapR
Hadoopクラスタを構成するノードと同居させる構成が可能
RDBMS
ストレージ
S3/HDFS/SFTP
クライアントPC
Copyright © K.K. Ashisuto
Paxataの強み
Copyright © K.K. Ashisuto
慣れ親しんだユーザインターフェース
25
実データを見て、ノンコーディング加工データフローを描ける
スキルが必要
スプレッドシートワークフロー
Copyright © K.K. Ashisuto
すべてのデータを高速に処理
26
必要なすべてのデータを対話的に加工サンプリングはデータを限定する
フルデータセットサンプリング
Copyright © K.K. Ashisuto
共有とガバナンスを実現
27
すべてのユーザステップが記録、
バージョン管理され、監査可能
Excel職人と変わらない
無秩序な状態
プラットフォームスタンドアロン
Excelなどによる手作業のデータ収集と準備
ワンタイム分析のためのデータ加工基盤
AIのインプットデータ作成
急増するデータ準備の課題 TOP3
手軽に、素早く
データが準備できる基盤が求められている
Copyright © K.K. Ashisuto
Core Server
Worker
Pipeline
Master
EMR/HDInsight
S3/WABS
より高速な環境構築と
運用負荷の軽減が可能に!
Hadoop as a Serviceに対応予定(’17秋)
RDBMS
ストレージ
S3/HDFS/SFTP/WABS
クライアントPC
AWS/Azure環境ではHadoop Distributionなしで構築可能
Copyright © K.K. Ashisuto
データ・プレパレーションの機能をクラウドでご利用いただける
SaaS型サービスを2017年9月1日にリリース
Cloud Powered by
5つの特徴
いつでもすぐに利用スタート!
インフラ設計や保守運用は不要!
Webブラウザさえあれば利用可能!
データ量に応じて3種類のモデルの中から選択!
初期コストを低減!
システムイメージ
ブラウザとデータがあれば
すぐに利用を開始できる!
Copyright © K.K. Ashisuto
まとめ
Copyright © K.K. Ashisuto
データドリブン時代のフレームワーク
32
データレイク
オープンデータ
第三者データ
予測分析・AI
E
T
L セントラルウェア
ハウス データマート
ローカルファイル
エンタープライズBI
IT部門の
管理範囲
業務
システム
データウェアハウス
セルフサービスBI
クラウドシステム
データ活用の民主化を支える
「データ共有基盤」
Copyright © K.K. Ashisuto
アシスト Paxata
弊社Webサイトをチェック
Paxata Cloud
Copyright © K.K. Ashisuto
ご清聴ありがとうございました

More Related Content

What's hot

Expectations and reality of hybrid cloud
Expectations and reality of hybrid cloudExpectations and reality of hybrid cloud
Expectations and reality of hybrid cloudNaoki Yonezu
 
Bluemixとapache sparkでできる io tデータの収集と分析
Bluemixとapache sparkでできる io tデータの収集と分析Bluemixとapache sparkでできる io tデータの収集と分析
Bluemixとapache sparkでできる io tデータの収集と分析Mitsutoshi Kiuchi
 
深層学習の導入で抱える課題とユースケース実例
深層学習の導入で抱える課題とユースケース実例	深層学習の導入で抱える課題とユースケース実例
深層学習の導入で抱える課題とユースケース実例 Hirono Jumpei
 
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンドプランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンドYahoo!デベロッパーネットワーク
 
データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiCデータの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiCYahoo!デベロッパーネットワーク
 
Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)
Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)
Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)Hiroshi Ohnuki
 
[Livesence Tech Night] グリーにおけるHiveの運用
[Livesence Tech Night] グリーにおけるHiveの運用[Livesence Tech Night] グリーにおけるHiveの運用
[Livesence Tech Night] グリーにおけるHiveの運用gree_tech
 
Py conjp2017ジョブフェア
Py conjp2017ジョブフェアPy conjp2017ジョブフェア
Py conjp2017ジョブフェア創史 花村
 
6製品1サービスの開発にPortfolio for JIRAを使ってみた
6製品1サービスの開発にPortfolio for JIRAを使ってみた6製品1サービスの開発にPortfolio for JIRAを使ってみた
6製品1サービスの開発にPortfolio for JIRAを使ってみたHiroshi Ohnuki
 
【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用Hirono Jumpei
 
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試みデータテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試みYahoo!デベロッパーネットワーク
 
IoTにおけるクラウドインフラからサーバサイドまでの概要的な話
IoTにおけるクラウドインフラからサーバサイドまでの概要的な話IoTにおけるクラウドインフラからサーバサイドまでの概要的な話
IoTにおけるクラウドインフラからサーバサイドまでの概要的な話Terui Masashi
 
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについてドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについてHirono Jumpei
 
新時代のエンタープライズデータマネジメント Drupal expo2017
新時代のエンタープライズデータマネジメント� Drupal expo2017新時代のエンタープライズデータマネジメント� Drupal expo2017
新時代のエンタープライズデータマネジメント Drupal expo2017惠 紀野
 

What's hot (20)

Expectations and reality of hybrid cloud
Expectations and reality of hybrid cloudExpectations and reality of hybrid cloud
Expectations and reality of hybrid cloud
 
Bluemixとapache sparkでできる io tデータの収集と分析
Bluemixとapache sparkでできる io tデータの収集と分析Bluemixとapache sparkでできる io tデータの収集と分析
Bluemixとapache sparkでできる io tデータの収集と分析
 
深層学習の導入で抱える課題とユースケース実例
深層学習の導入で抱える課題とユースケース実例	深層学習の導入で抱える課題とユースケース実例
深層学習の導入で抱える課題とユースケース実例
 
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンドプランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
 
データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiCデータの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiC
 
[Japan Tech summit 2017] DAL 008
[Japan Tech summit 2017] DAL 008[Japan Tech summit 2017] DAL 008
[Japan Tech summit 2017] DAL 008
 
Hccjp purpose andhistory
Hccjp purpose andhistoryHccjp purpose andhistory
Hccjp purpose andhistory
 
Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)
Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)
Atlassian Summit Europe 2017の参加報告(Aug Tokyo #22)
 
[Livesence Tech Night] グリーにおけるHiveの運用
[Livesence Tech Night] グリーにおけるHiveの運用[Livesence Tech Night] グリーにおけるHiveの運用
[Livesence Tech Night] グリーにおけるHiveの運用
 
Py conjp2017ジョブフェア
Py conjp2017ジョブフェアPy conjp2017ジョブフェア
Py conjp2017ジョブフェア
 
6製品1サービスの開発にPortfolio for JIRAを使ってみた
6製品1サービスの開発にPortfolio for JIRAを使ってみた6製品1サービスの開発にPortfolio for JIRAを使ってみた
6製品1サービスの開発にPortfolio for JIRAを使ってみた
 
【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用【Dll171201】深層学習利活用の紹介 掲載用
【Dll171201】深層学習利活用の紹介 掲載用
 
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試みデータテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
 
IoTにおけるクラウドインフラからサーバサイドまでの概要的な話
IoTにおけるクラウドインフラからサーバサイドまでの概要的な話IoTにおけるクラウドインフラからサーバサイドまでの概要的な話
IoTにおけるクラウドインフラからサーバサイドまでの概要的な話
 
[Japan Tech summit 2017] PRD 011
[Japan Tech summit 2017] PRD 011[Japan Tech summit 2017] PRD 011
[Japan Tech summit 2017] PRD 011
 
[Japan Tech summit 2017] MAI 005
[Japan Tech summit 2017] MAI 005[Japan Tech summit 2017] MAI 005
[Japan Tech summit 2017] MAI 005
 
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについてドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
ドキュメント自動入力AIプラットフォーム ディープシグマDPAについて
 
新時代のエンタープライズデータマネジメント Drupal expo2017
新時代のエンタープライズデータマネジメント� Drupal expo2017新時代のエンタープライズデータマネジメント� Drupal expo2017
新時代のエンタープライズデータマネジメント Drupal expo2017
 
[Japan Tech summit 2017] CLD 021
[Japan Tech summit 2017]  CLD 021[Japan Tech summit 2017]  CLD 021
[Japan Tech summit 2017] CLD 021
 
[Japan Tech summit 2017] CLD 022
[Japan Tech summit 2017]  CLD 022[Japan Tech summit 2017]  CLD 022
[Japan Tech summit 2017] CLD 022
 

Similar to [db tech showcase Tokyo 2017] D25: データの分析や解析の前に必要となる「データ準備」とは。データ・プレパレーション・プラットフォーム『Paxata』 by 株式会社アシスト 山口晃司

[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...
[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...
[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...Insight Technology, Inc.
 
ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本Toshikuni Fuji
 
IBM WatsonでInnovationを
IBM WatsonでInnovationをIBM WatsonでInnovationを
IBM WatsonでInnovationをKenichi Inoue
 
Watson IoTとIBM DSXでWatsonと役割分担
Watson IoTとIBM DSXでWatsonと役割分担Watson IoTとIBM DSXでWatsonと役割分担
Watson IoTとIBM DSXでWatsonと役割分担Kenichi Inoue
 
プロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なことプロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なことKazuhito Osabe
 
データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料The Japan DataScientist Society
 
kintone Café 愛媛 Vol.7
kintone Café 愛媛 Vol.7kintone Café 愛媛 Vol.7
kintone Café 愛媛 Vol.7kintone papers
 
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)takumibp
 
Watson IoT Platform全貌解説
Watson IoT Platform全貌解説Watson IoT Platform全貌解説
Watson IoT Platform全貌解説Kenichi Inoue
 
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~NTT DATA OSS Professional Services
 
データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】Tetsuya Yoshida
 
エンタープライズ向けクラウドサービスにおける ID 連携の有用性
エンタープライズ向けクラウドサービスにおける ID 連携の有用性エンタープライズ向けクラウドサービスにおける ID 連携の有用性
エンタープライズ向けクラウドサービスにおける ID 連携の有用性Koji Asaga
 
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」Noriaki Takahashi
 
事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団
事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団
事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団Kohei MATSUSHITA
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Hideto Masuoka
 
Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料kimihikoeto
 
kintoneでビジュアル操作
kintoneでビジュアル操作kintoneでビジュアル操作
kintoneでビジュアル操作Cybozucommunity
 
Kintoneでビジュアル操作 公開用
Kintoneでビジュアル操作 公開用Kintoneでビジュアル操作 公開用
Kintoneでビジュアル操作 公開用Junya Kume
 
2016年12月期 決算説明資料
2016年12月期 決算説明資料2016年12月期 決算説明資料
2016年12月期 決算説明資料SIOS Corporation
 

Similar to [db tech showcase Tokyo 2017] D25: データの分析や解析の前に必要となる「データ準備」とは。データ・プレパレーション・プラットフォーム『Paxata』 by 株式会社アシスト 山口晃司 (20)

[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...
[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...
[db analytics showcase Sapporo 2017] B11: データ活用の民主化に最短ルートで到達するには? by 株式会社アシスト...
 
ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本
 
IBM WatsonでInnovationを
IBM WatsonでInnovationをIBM WatsonでInnovationを
IBM WatsonでInnovationを
 
Watson IoTとIBM DSXでWatsonと役割分担
Watson IoTとIBM DSXでWatsonと役割分担Watson IoTとIBM DSXでWatsonと役割分担
Watson IoTとIBM DSXでWatsonと役割分担
 
プロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なことプロダクト中心のデータ駆動を推進していくために必要なこと
プロダクト中心のデータ駆動を推進していくために必要なこと
 
データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料データサイエンティスト協会 会員制度説明資料
データサイエンティスト協会 会員制度説明資料
 
kintone Café 愛媛 Vol.7
kintone Café 愛媛 Vol.7kintone Café 愛媛 Vol.7
kintone Café 愛媛 Vol.7
 
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
 
Watson IoT Platform全貌解説
Watson IoT Platform全貌解説Watson IoT Platform全貌解説
Watson IoT Platform全貌解説
 
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
 
データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】
 
エンタープライズ向けクラウドサービスにおける ID 連携の有用性
エンタープライズ向けクラウドサービスにおける ID 連携の有用性エンタープライズ向けクラウドサービスにおける ID 連携の有用性
エンタープライズ向けクラウドサービスにおける ID 連携の有用性
 
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
20171031エンジニア交流会 Google Apps Script ミートアップ「『壁』超える鍵としてのGAS」
 
事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団
事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団
事例とキーワードで紐解くIoT / JAWS-UG長崎支部 Re:Boot! 第一回勉強会@長崎県産業振興財団
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
 
Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料Pentahoデータ統合・ETLセミナー 紹介資料
Pentahoデータ統合・ETLセミナー 紹介資料
 
TwilioKintone20171012
TwilioKintone20171012TwilioKintone20171012
TwilioKintone20171012
 
kintoneでビジュアル操作
kintoneでビジュアル操作kintoneでビジュアル操作
kintoneでビジュアル操作
 
Kintoneでビジュアル操作 公開用
Kintoneでビジュアル操作 公開用Kintoneでビジュアル操作 公開用
Kintoneでビジュアル操作 公開用
 
2016年12月期 決算説明資料
2016年12月期 決算説明資料2016年12月期 決算説明資料
2016年12月期 決算説明資料
 

More from Insight Technology, Inc.

グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?Insight Technology, Inc.
 
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Insight Technology, Inc.
 
事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明するInsight Technology, Inc.
 
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーンInsight Technology, Inc.
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとInsight Technology, Inc.
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?Insight Technology, Inc.
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームInsight Technology, Inc.
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門Insight Technology, Inc.
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー Insight Technology, Inc.
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?Insight Technology, Inc.
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Insight Technology, Inc.
 
そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?Insight Technology, Inc.
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...Insight Technology, Inc.
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 Insight Technology, Inc.
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Insight Technology, Inc.
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]Insight Technology, Inc.
 

More from Insight Technology, Inc. (20)

グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
 
Docker and the Oracle Database
Docker and the Oracle DatabaseDocker and the Oracle Database
Docker and the Oracle Database
 
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
 
事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する
 
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
 
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL ServicesLunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
 
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
 
そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
 

[db tech showcase Tokyo 2017] D25: データの分析や解析の前に必要となる「データ準備」とは。データ・プレパレーション・プラットフォーム『Paxata』 by 株式会社アシスト 山口晃司

  • 1. Copyright © K.K. Ashisuto データの分析や解析の前に必要となる「データ準備」とは。 データ・プレパレーション・プラットフォーム『Paxata』 2017年9月6日 株式会社アシスト 情報基盤技術統括部 技術2部 山口晃司
  • 2. Copyright © K.K. Ashisuto 講師紹介 2 山口 晃司 株式会社アシスト 情報基盤技術統括部 技術2部 アシスト入社後、BI製品のサポート、フィールド業務を経て、2016年よりデータ・ プレパレーション・プラットフォーム「Paxata」の製品技術として顧客への提案、導入、 開発支援を担当。
  • 3. Copyright © K.K. Ashisuto アシストについて 設立 1972年3月 代表取締役会長 ビル・トッテン 代表取締役社長 大塚 辰男 資本金 6,000万円 売上高 262億円(2016年度) 社員数 1,075名(2017年4月) ※グループ会社含む 事業内容 コンピュータ用パッケージ・ソフト ウェアの販売、技術サポート、教育 およびコンサルティング 本社所在地 東京都千代田区九段北4-2-1 市ヶ谷東急ビル オフィス所在地 札幌、仙台、名古屋、金沢、大阪、 広島、宇部、福岡、沖縄 取引会社数 6,000社(2016年度) 主要取扱製品数 60製品 (2017年4月現在) グループ会社 株式会社アシスト北海道 株式会社のれん ※サポートセンターのみ 金沢 札幌 仙台 東京本社 名古屋 宇部 福岡 広島 大阪 沖縄 ※グループ会社:㈱アシスト北海道 併設 サポート センター ※グループ会社: ㈱のれん 併設 3
  • 5. Copyright © K.K. Ashisuto データ・プレパレーション
  • 6. Copyright © K.K. Ashisuto E T L データマネジメントが困難な時代に セントラル ウェアハウス データマート クラウドシステム ローカルファイル エンタープライズBIIT部門の 管理範囲 セルフサービスBI データレイク IoT 予測分析 オープンデータ 第三者データ 業務 システム AI・機械学習 センサー データ IoT IoT データウェアハウス 既存の仕組みだけでは、 データドリブン経営は実現できない?!
  • 7. Copyright © K.K. Ashisuto 「データ」と「情報」の違い 情報データ 完成されており クリーンで 意味付けがあって すぐに活用できる CRM 企業情報 会計データ ソーシャル メディア ERP マシン データ
  • 9. Copyright © K.K. Ashisuto 9 データ・プレパレーションとは? 企業内外に存在するデータを IT部門だけでなく、ユーザ部門自らが 消費可能な情報に加工・変換すること
  • 10. Copyright © K.K. Ashisuto Paxata, Inc. Paxata 社はデータドリブン経営を実現するデータプレパレーションプラットフォームの提供を 目指して製品の開発を行っています。 • 2012年にカリフォルニアで設立 • 2013年11月に製品版をリリース • 現在のユーザ数は100社以上 幅広い業種で100社以上の採用 10
  • 11. Copyright © K.K. Ashisuto データ・プレパレーションの業界リーダーに選出 11
  • 13. Copyright © K.K. Ashisuto Paxata システムイメージ データレイク エンタープライズ ローカル 探索 整形 データ 追加 発行 整備 変更 強化 統合 デ ー タ セ ッ ト 格 納 メ モ リ 展 開 ア ン サ ー セ ッ ト 格 納 デ ー タ エ ク ス ポ ー ト データ エンジニア データ サイエンティスト AI 機械学習 BI ディベロッパー BI パワーユーザ BI コンシューマー HDFS 13
  • 14. Copyright © K.K. Ashisuto デモンストレーション
  • 15. Copyright © K.K. Ashisuto デモシナリオ 15 HDFS Webキャンペーン ログデータ リード情報 (顧客マスタ) データソース HDFS データ 追加 探索 整備 変更 整形 統合 強化 要件 ユーザ自身でWebキャンペーンのデータに顧客情報 を連携させたデータを作成し、BIツールで分析したい +
  • 16. Copyright © K.K. Ashisuto アーキテクチャ
  • 17. Copyright © K.K. Ashisuto アーキテクチャ Apache Sparkをエンジンに独自開発された データ加工を行うインメモリ分散処理エンジン 分散処理の技術を取り入れたスケーラブルな構成が可能 Visually Dynamic Multi-User Interface HTML5を使用したユーザインターフェース Javaで開発されたWeb Service 加工前のデータセットと加工後に出力された Answersetを格納するためのHDFS Data Prep Application Web Services Parallel In-Memory Pipelined Data Prep Engine Powered by Intellifusion Distributed Processing Engine Data Management in Hadoop Distributed File System Paxataは以下の4構造でシステムを構成
  • 18. Copyright © K.K. Ashisuto サーバの構成と役割 Core Server Worker DataNode RDBMS ストレージ S3/HDFS/SFTP クライアントPC Pipeline Master NameNode ユーザ要求の分散処理 インポートもしくは Paxataで生成されたデータの格納先 データのインポート/エクスポート処理 UIや加工処理の要求を生成
  • 19. Copyright © K.K. Ashisuto データのインポート Core Server Worker DataNode JDBC HTTP/HTTPS Connector parquet データ 変換 Pipeline Master NameNode XLSX/CSV JSON/XML Table /View XLSX/CSV JSON/XML parquet RDBMS ストレージ S3/HDFS/SFTP クライアントPC DATA →parquet Paxataで使用するデータを登録 データ単位で利用可能なユーザを制限し共有 することが可能 インポートする データを選択
  • 20. Copyright © K.K. Ashisuto プロジェクト作成 Core Server Pipeline WorkerMaster NameNode DataNode parquet parquet cache データ 変換 画面 生成 RDBMS ストレージ S3/HDFS/SFTP クライアントPC DATA DATA parquet →DATA ブラウザ上のGUI操作でSparkへデータ加工 処理のリクエストを送信 加工結果をリアルタイムに参照しながら処理を 進めることができる 分散処理 データセットを 選択
  • 21. Copyright © K.K. Ashisuto AnswerSet出力 Core Server Worker DataNode parquet parquet cache cache cache データ 変換 Pipeline Master NameNode RDBMS ストレージ S3/HDFS/SFTP クライアントPC DATA DATA →parquet parquet Paxata上で生成されたデータを AnswerSetとしてHDFSへ出力し、 新たなデータを作成可能 分散処理 AnswerSetを Publish
  • 22. Copyright © K.K. Ashisuto データのエクスポート Core Server Worker DataNode JDBC HTTP/HTTPS Connector parquet データ 変換 Pipeline Master NameNode Table XLSX/CSV JSON/XML parquet parquet cache cache cache parquet RDBMS ストレージ S3/HDFS/SFTP クライアントPC parquet →DATA ユーザは生成したデータを管理された 任意の出力先へエクスポートしテーブルや ファイルとして参照することが可能 エクスポート するデータを選択 XLSX/CSV JSON/XML
  • 23. Copyright © K.K. Ashisuto 実際のサーバ構成では、、、 Core Server Worker DataNode Pipeline Master NameNode (YARN) Hadoop Distribution Cloudera/Hortonworks/MapR Hadoopクラスタを構成するノードと同居させる構成が可能 RDBMS ストレージ S3/HDFS/SFTP クライアントPC
  • 24. Copyright © K.K. Ashisuto Paxataの強み
  • 25. Copyright © K.K. Ashisuto 慣れ親しんだユーザインターフェース 25 実データを見て、ノンコーディング加工データフローを描ける スキルが必要 スプレッドシートワークフロー
  • 26. Copyright © K.K. Ashisuto すべてのデータを高速に処理 26 必要なすべてのデータを対話的に加工サンプリングはデータを限定する フルデータセットサンプリング
  • 27. Copyright © K.K. Ashisuto 共有とガバナンスを実現 27 すべてのユーザステップが記録、 バージョン管理され、監査可能 Excel職人と変わらない 無秩序な状態 プラットフォームスタンドアロン
  • 29. Copyright © K.K. Ashisuto Core Server Worker Pipeline Master EMR/HDInsight S3/WABS より高速な環境構築と 運用負荷の軽減が可能に! Hadoop as a Serviceに対応予定(’17秋) RDBMS ストレージ S3/HDFS/SFTP/WABS クライアントPC AWS/Azure環境ではHadoop Distributionなしで構築可能
  • 30. Copyright © K.K. Ashisuto データ・プレパレーションの機能をクラウドでご利用いただける SaaS型サービスを2017年9月1日にリリース Cloud Powered by 5つの特徴 いつでもすぐに利用スタート! インフラ設計や保守運用は不要! Webブラウザさえあれば利用可能! データ量に応じて3種類のモデルの中から選択! 初期コストを低減! システムイメージ ブラウザとデータがあれば すぐに利用を開始できる!
  • 31. Copyright © K.K. Ashisuto まとめ
  • 32. Copyright © K.K. Ashisuto データドリブン時代のフレームワーク 32 データレイク オープンデータ 第三者データ 予測分析・AI E T L セントラルウェア ハウス データマート ローカルファイル エンタープライズBI IT部門の 管理範囲 業務 システム データウェアハウス セルフサービスBI クラウドシステム データ活用の民主化を支える 「データ共有基盤」
  • 33. Copyright © K.K. Ashisuto アシスト Paxata 弊社Webサイトをチェック Paxata Cloud
  • 34. Copyright © K.K. Ashisuto ご清聴ありがとうございました