SlideShare a Scribd company logo
1 of 26
Tableau + Pythonと
データのあり方
Tableau データサイエンス勉強会第4回
About Me
荒木 和也
Kazuya Araki
Knight of Tableau DATA Saber
受託開発 -> パッケージ開発 -> 某HR Tech & 個人事業
Engineer -> Data Analyst / Data Enginieer / Data Archtect
Love: Data
Hobby: J-Rock, Snow Sports, PC Game, Board Game etc(100+)https://www.facebook.com/kazuya.araki.tokyo
@kazuya_araki_jp
https://note.mu/jedi_trickstar
https://public.tableau.com/profile/kazuya.araki#!/
お話しすること
最近考えている、思っていることについて語ってみます。
(サイエンスよりは、エンジニアリングの与太話となります)
● データとTableau(Desktop)の関係
● TableauとPython
お話ししないこと
10分では足りないので。
● PythonのHow
● TabPyの細かい話(本当は語りたい)
データとTableau(Desktop)の関係
基本はETL(データパイプライン)の考え方
Tableau(Desktop)は優秀
優秀すぎるが故の罠
優秀すぎるが故の罠
例: 計算フィールド多すぎ問題
● 単純にパフォーマンスが劣化する。
● メジャーの視認性が悪くなる。
● メジャー名を正しく定義しないと使うときに困る。
● 計算式が正しくなかった場合のレビューがとても難しい。
○ レビュワーもCreatorユーザーでなければならない。
etc...
優秀すぎるが故の罠
優秀すぎるが故の罠
例: カスタムSQL
● SQLが実行できるデータソースで発生しうる。
○ データマート構築が進んでいない場合。
○ サービズデータを無加工でデータウェアハウスに格納して
いる場合。
○ 総じて、データエンジニアリングが未熟なフェーズ。
● Tableau Desktopのウインドウだと視認性が良くない。
● SQLが正しくなかった場合のレビューがとても難しい。
○ レビュワーもCreatorユーザーでなければならない。
○ 計算フィールドと複合していると原因特定に詰む。
○ SQLを書いた本人ですらわからない場合もある。
etc...
(フォーマッターかけて)
800行超あるSQL
気をつけないと痛い目を見る
構成を考えてみる🤔
最近の推しの構成
最近の推しの構成
役割分担と構成管理
データ加工とデータ可視化を分けた方がよさそう
● データ加工 = SQL / Python / Tableau Prep Builder
○ GitHubでコードを管理する。
■ データ定義を残す。
■ 再現性を担保する(= 誰が使っても同じ結果になる保証)。
○ SQLはデータベース、SQLでできないことはPythonに任せる。
○ API系はPython。
○ Tableau Prepは可能性しかない。今後に期待。
■ ただし、Prep Conductorまで使うには別途追加料金が必要。
● データ可視化 = Tableau Desktop
○ Tableau側はデータについて関与しない。
○ Tableauはデータ可視化にだけ、注力するようにする。
TableauとPython
Python IDEの構成 from あらき
TabPyの登場
Tableau内でPythonが記述可能に
TabPy
リプレース可能?
TabPy
🤔
一人Zen問答したメモ at 2019/10/01
● TabPyの位置付けは計算フィールドと変わらないので、データパイプライン
を考えると、役割分担ができない。
● 一方で、TabPyは構築さえできてしまえばTableau内で完結するので、楽とい
えば楽。
● どちらが優れているかは現時点では判断できない。
● 少なくとも、2人以上が関わるようになった場合は、Tableau内であれこれや
るよりも、ちゃんと思考開示して共有できるようにしないと属人化は進むだ
ろう。
○ Citizen Data Scientists向け?
○ Data Engineerをかかえている組織であれば、分業した方が効率は良い?
もう少し、ざっくばらんに
議論したいです
※背景画像はイメージです
まとめ
● データとTableau(Desktop)の関係
○ データパイプラインを意識する = ツールに適した役割分担をする。
○ データ定義はTableau(Desktop)内で行うべきではない(のが個人的見解)。
○ なんでもTableau(Desktop)で解決しようとしない。
● TableauとPythonTabPy
○ データパイプラインを意識すると、TabPyの導入意義が薄れてしまう(のが個人的見解)。
○ もう少し深掘りしていきたいです🙇
Tableau + Pythonとデータのあり方

More Related Content

What's hot

ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発LINE Corporation
 
Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会
Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会
Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会昌幸 目代
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)Yosuke Katsuki
 
プロが解説!Hinemosによる運用管理テクニック!
プロが解説!Hinemosによる運用管理テクニック!プロが解説!Hinemosによる運用管理テクニック!
プロが解説!Hinemosによる運用管理テクニック!hinemos_atomitech
 
A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)
A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)
A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)Hadoop / Spark Conference Japan
 
5.6 以前の InnoDB Flushing
5.6 以前の InnoDB Flushing5.6 以前の InnoDB Flushing
5.6 以前の InnoDB FlushingTakanori Sejima
 
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...TakeshiFukae
 
Snowflake Elastic Data Warehouse as a Service
Snowflake Elastic Data Warehouse as a ServiceSnowflake Elastic Data Warehouse as a Service
Snowflake Elastic Data Warehouse as a ServiceMineaki Motohashi
 
OpenStack Trove 技術解説
OpenStack Trove 技術解説OpenStack Trove 技術解説
OpenStack Trove 技術解説Toru Makabe
 
第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料Daisuke Ikeda
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Keisuke Fujikawa
 
Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界Takahiro Inoue
 
データ分析基盤について
データ分析基盤についてデータ分析基盤について
データ分析基盤についてYuta Inamura
 
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnightYahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnightYahoo!デベロッパーネットワーク
 
データベース14 - データベース構造とインデックス
データベース14 - データベース構造とインデックスデータベース14 - データベース構造とインデックス
データベース14 - データベース構造とインデックスKenta Oku
 
新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとは新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとはapkiban
 
OpenSim の 使い方 (Static optimization 編)
OpenSim の 使い方 (Static optimization 編) OpenSim の 使い方 (Static optimization 編)
OpenSim の 使い方 (Static optimization 編) Yuichi Kurita
 
Tableauによるデータ可視化と機械学習によるデータ分析
Tableauによるデータ可視化と機械学習によるデータ分析Tableauによるデータ可視化と機械学習によるデータ分析
Tableauによるデータ可視化と機械学習によるデータ分析Tomohiro Iwahashi
 
Argoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたことArgoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたことShinsaku Kono
 

What's hot (20)

ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
ベイズ推定とDeep Learningを使用したレコメンドエンジン開発
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会
Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会
Office365 の Teamsというチャットツールはこうやって使うんだよ 社内説明会
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 
プロが解説!Hinemosによる運用管理テクニック!
プロが解説!Hinemosによる運用管理テクニック!プロが解説!Hinemosによる運用管理テクニック!
プロが解説!Hinemosによる運用管理テクニック!
 
A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)
A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)
A Deeper Understanding of Spark Internals (Hadoop Conference Japan 2014)
 
5.6 以前の InnoDB Flushing
5.6 以前の InnoDB Flushing5.6 以前の InnoDB Flushing
5.6 以前の InnoDB Flushing
 
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
 
Snowflake Elastic Data Warehouse as a Service
Snowflake Elastic Data Warehouse as a ServiceSnowflake Elastic Data Warehouse as a Service
Snowflake Elastic Data Warehouse as a Service
 
OpenStack Trove 技術解説
OpenStack Trove 技術解説OpenStack Trove 技術解説
OpenStack Trove 技術解説
 
第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料第6回zabbix jp勉強会資料
第6回zabbix jp勉強会資料
 
Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門Data Factory V2 新機能徹底活用入門
Data Factory V2 新機能徹底活用入門
 
Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界
 
データ分析基盤について
データ分析基盤についてデータ分析基盤について
データ分析基盤について
 
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnightYahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
 
データベース14 - データベース構造とインデックス
データベース14 - データベース構造とインデックスデータベース14 - データベース構造とインデックス
データベース14 - データベース構造とインデックス
 
新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとは新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとは
 
OpenSim の 使い方 (Static optimization 編)
OpenSim の 使い方 (Static optimization 編) OpenSim の 使い方 (Static optimization 編)
OpenSim の 使い方 (Static optimization 編)
 
Tableauによるデータ可視化と機械学習によるデータ分析
Tableauによるデータ可視化と機械学習によるデータ分析Tableauによるデータ可視化と機械学習によるデータ分析
Tableauによるデータ可視化と機械学習によるデータ分析
 
Argoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたことArgoによる機械学習実行基盤の構築・運用からみえてきたこと
Argoによる機械学習実行基盤の構築・運用からみえてきたこと
 

Similar to Tableau + Pythonとデータのあり方

DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキルDBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキルSatoshi Yamada
 
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1Hiroshi Masuda
 
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07Sotaro Tanaka
 
Tableauから始める機械学習ーやってみようPython連携_2019-05-23
Tableauから始める機械学習ーやってみようPython連携_2019-05-23Tableauから始める機械学習ーやってみようPython連携_2019-05-23
Tableauから始める機械学習ーやってみようPython連携_2019-05-23Tomohiro Iwahashi
 
データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方Tomoyuki Oota
 
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)NTT DATA OSS Professional Services
 
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PyData入門(超初心者編)~野球のデータをカジュアルに可視化PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PyData入門(超初心者編)~野球のデータをカジュアルに可視化Shinichi Nakagawa
 
すごいタスク管理(仮)
すごいタスク管理(仮)すごいタスク管理(仮)
すごいタスク管理(仮)Kakigi Katuyuki
 
Prepを使ってデータを武器にしよう!
Prepを使ってデータを武器にしよう!Prepを使ってデータを武器にしよう!
Prepを使ってデータを武器にしよう!AkiKusaka
 
Prepを使ってデータを武器にしよう
Prepを使ってデータを武器にしようPrepを使ってデータを武器にしよう
Prepを使ってデータを武器にしようAkiKusaka
 
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニアYu Yamada
 
「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介Takekatsu Hiramura
 
Pub tableau ladiesusergroup_14
Pub tableau ladiesusergroup_14Pub tableau ladiesusergroup_14
Pub tableau ladiesusergroup_14Tableau1
 
れこめん道~とあるエンジニアの苦闘の日々
れこめん道~とあるエンジニアの苦闘の日々 れこめん道~とあるエンジニアの苦闘の日々
れこめん道~とあるエンジニアの苦闘の日々 BrainPad Inc.
 
「れこめん道」~とあるエンジニアの苦闘の日々
「れこめん道」~とあるエンジニアの苦闘の日々「れこめん道」~とあるエンジニアの苦闘の日々
「れこめん道」~とあるエンジニアの苦闘の日々yagizo
 
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方Yu Yamada
 
データサイエンティストの今
データサイエンティストの今データサイエンティストの今
データサイエンティストの今Suzuki Shinji
 
構造化データをツールで簡単に分析
構造化データをツールで簡単に分析構造化データをツールで簡単に分析
構造化データをツールで簡単に分析Yoshitaka Seo
 

Similar to Tableau + Pythonとデータのあり方 (20)

DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキルDBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
 
Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
Tableau r graph_theory
Tableau r graph_theoryTableau r graph_theory
Tableau r graph_theory
 
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
 
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
データアナリストとログ基盤の付き合い方 DataAnalystMeetup#07
 
Tableauから始める機械学習ーやってみようPython連携_2019-05-23
Tableauから始める機械学習ーやってみようPython連携_2019-05-23Tableauから始める機械学習ーやってみようPython連携_2019-05-23
Tableauから始める機械学習ーやってみようPython連携_2019-05-23
 
データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方データ分析プラットフォームの歩き方
データ分析プラットフォームの歩き方
 
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
 
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PyData入門(超初心者編)~野球のデータをカジュアルに可視化PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
 
すごいタスク管理(仮)
すごいタスク管理(仮)すごいタスク管理(仮)
すごいタスク管理(仮)
 
Prepを使ってデータを武器にしよう!
Prepを使ってデータを武器にしよう!Prepを使ってデータを武器にしよう!
Prepを使ってデータを武器にしよう!
 
Prepを使ってデータを武器にしよう
Prepを使ってデータを武器にしようPrepを使ってデータを武器にしよう
Prepを使ってデータを武器にしよう
 
僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア僕の考える最強のビックデータエンジニア
僕の考える最強のビックデータエンジニア
 
「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介「R for Cloud Computing」の紹介
「R for Cloud Computing」の紹介
 
Pub tableau ladiesusergroup_14
Pub tableau ladiesusergroup_14Pub tableau ladiesusergroup_14
Pub tableau ladiesusergroup_14
 
れこめん道~とあるエンジニアの苦闘の日々
れこめん道~とあるエンジニアの苦闘の日々 れこめん道~とあるエンジニアの苦闘の日々
れこめん道~とあるエンジニアの苦闘の日々
 
「れこめん道」~とあるエンジニアの苦闘の日々
「れこめん道」~とあるエンジニアの苦闘の日々「れこめん道」~とあるエンジニアの苦闘の日々
「れこめん道」~とあるエンジニアの苦闘の日々
 
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
リクルートライフスタイルが考える、万人に使ってもらえる分析基盤の作り方
 
データサイエンティストの今
データサイエンティストの今データサイエンティストの今
データサイエンティストの今
 
構造化データをツールで簡単に分析
構造化データをツールで簡単に分析構造化データをツールで簡単に分析
構造化データをツールで簡単に分析
 

Tableau + Pythonとデータのあり方