Submit Search
Upload
アドテクスタジオのデータ分析基盤について
•
Download as PPTX, PDF
•
3 likes
•
6,961 views
K
kazuhiro ito
Follow
2017年9月22日(金) 開催 「Data Engineering and Data Analysis Workshop #2」登壇資料
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 56
Download now
Recommended
[VP of Engineering Meetup] エンジニアのパフォーマンスを最大化させる組織活性化施策とは
[VP of Engineering Meetup] エンジニアのパフォーマンスを最大化させる組織活性化施策とは
atsuki_ito
All about 開発本部infra部 TASKs
All about 開発本部infra部 TASKs
gree_tech
エンジニア採用における技術広報の重要ポイント
エンジニア採用における技術広報の重要ポイント
Noriaki Kadota
サーバレスアーキテクチャにしてみた【デブサミ2017 17-E-2】
サーバレスアーキテクチャにしてみた【デブサミ2017 17-E-2】
dreamarts_pr
今、おさえておきたい DevOps
今、おさえておきたい DevOps
智治 長沢
ハイブリッドクラウドで変わるインフラストラクチャ設計
ハイブリッドクラウドで変わるインフラストラクチャ設計
gree_tech
ADセキュリティワークショップ WG活動報告 _第2回全体ミーティング
ADセキュリティワークショップ WG活動報告 _第2回全体ミーティング
ID-Based Security イニシアティブ
Developer's summit 2021 [19-D-5]なぜ今、ローコードなのか
Developer's summit 2021 [19-D-5]なぜ今、ローコードなのか
Tetsuo Ajima
Recommended
[VP of Engineering Meetup] エンジニアのパフォーマンスを最大化させる組織活性化施策とは
[VP of Engineering Meetup] エンジニアのパフォーマンスを最大化させる組織活性化施策とは
atsuki_ito
All about 開発本部infra部 TASKs
All about 開発本部infra部 TASKs
gree_tech
エンジニア採用における技術広報の重要ポイント
エンジニア採用における技術広報の重要ポイント
Noriaki Kadota
サーバレスアーキテクチャにしてみた【デブサミ2017 17-E-2】
サーバレスアーキテクチャにしてみた【デブサミ2017 17-E-2】
dreamarts_pr
今、おさえておきたい DevOps
今、おさえておきたい DevOps
智治 長沢
ハイブリッドクラウドで変わるインフラストラクチャ設計
ハイブリッドクラウドで変わるインフラストラクチャ設計
gree_tech
ADセキュリティワークショップ WG活動報告 _第2回全体ミーティング
ADセキュリティワークショップ WG活動報告 _第2回全体ミーティング
ID-Based Security イニシアティブ
Developer's summit 2021 [19-D-5]なぜ今、ローコードなのか
Developer's summit 2021 [19-D-5]なぜ今、ローコードなのか
Tetsuo Ajima
スタートアップを目指す零細企業のエンジニア採用事情
スタートアップを目指す零細企業のエンジニア採用事情
Kohji Osamura
NuxtJS + SSRで作ったGREE Tech Conference 2020
NuxtJS + SSRで作ったGREE Tech Conference 2020
gree_tech
【19-B-1】情シスの中のアーキテクト ~ソフトウェアアーキテクチャを超えて~
【19-B-1】情シスの中のアーキテクト ~ソフトウェアアーキテクチャを超えて~
Developers Summit
翻訳QAでのテスト自動化の取り組み
翻訳QAでのテスト自動化の取り組み
gree_tech
信頼されるエンジニアへの貴重な一歩! テストのお勉強はどうやるの?
信頼されるエンジニアへの貴重な一歩! テストのお勉強はどうやるの?
Egawa Saori
20190117 teamup
20190117 teamup
Katsuhiro Honda
Osashimi
Osashimi
Egawa Saori
ノーコードとアジャイル
ノーコードとアジャイル
Yukio Okajima
事業成長にコミットするエンジニア組織への道のり
事業成長にコミットするエンジニア組織への道のり
Recruit Lifestyle Co., Ltd.
DevOps時代の開発環境と現場体験 [#cmdevio2015]
DevOps時代の開発環境と現場体験 [#cmdevio2015]
智治 長沢
Shinogi meetup online_20200729
Shinogi meetup online_20200729
Naotaka Shinogi
kintone hack 真のファストシステムへ
kintone hack 真のファストシステムへ
Cybozucommunity
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
Iida Yukako
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
gree_tech
Meetup0729 xi leap
Meetup0729 xi leap
Ito Hiroki
「失敗事例から学ぶアジャイル開発」研修の紹介
「失敗事例から学ぶアジャイル開発」研修の紹介
ESM SEC
20171201_02_idb_security_wg発表_p
20171201_02_idb_security_wg発表_p
ID-Based Security イニシアティブ
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
cyberagent
最新版Hadoopクラスタを運用して得られたもの
最新版Hadoopクラスタを運用して得られたもの
cyberagent
AbemaTV モバイルアプリの開発体制と開発プロセスの話
AbemaTV モバイルアプリの開発体制と開発プロセスの話
Yuji Hato
AbemaTV デザインのBefore & After
AbemaTV デザインのBefore & After
Shunsuke Matsumoto
Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
Kosetsu Tsukuda
More Related Content
What's hot
スタートアップを目指す零細企業のエンジニア採用事情
スタートアップを目指す零細企業のエンジニア採用事情
Kohji Osamura
NuxtJS + SSRで作ったGREE Tech Conference 2020
NuxtJS + SSRで作ったGREE Tech Conference 2020
gree_tech
【19-B-1】情シスの中のアーキテクト ~ソフトウェアアーキテクチャを超えて~
【19-B-1】情シスの中のアーキテクト ~ソフトウェアアーキテクチャを超えて~
Developers Summit
翻訳QAでのテスト自動化の取り組み
翻訳QAでのテスト自動化の取り組み
gree_tech
信頼されるエンジニアへの貴重な一歩! テストのお勉強はどうやるの?
信頼されるエンジニアへの貴重な一歩! テストのお勉強はどうやるの?
Egawa Saori
20190117 teamup
20190117 teamup
Katsuhiro Honda
Osashimi
Osashimi
Egawa Saori
ノーコードとアジャイル
ノーコードとアジャイル
Yukio Okajima
事業成長にコミットするエンジニア組織への道のり
事業成長にコミットするエンジニア組織への道のり
Recruit Lifestyle Co., Ltd.
DevOps時代の開発環境と現場体験 [#cmdevio2015]
DevOps時代の開発環境と現場体験 [#cmdevio2015]
智治 長沢
Shinogi meetup online_20200729
Shinogi meetup online_20200729
Naotaka Shinogi
kintone hack 真のファストシステムへ
kintone hack 真のファストシステムへ
Cybozucommunity
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
Iida Yukako
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
gree_tech
Meetup0729 xi leap
Meetup0729 xi leap
Ito Hiroki
「失敗事例から学ぶアジャイル開発」研修の紹介
「失敗事例から学ぶアジャイル開発」研修の紹介
ESM SEC
20171201_02_idb_security_wg発表_p
20171201_02_idb_security_wg発表_p
ID-Based Security イニシアティブ
What's hot
(17)
スタートアップを目指す零細企業のエンジニア採用事情
スタートアップを目指す零細企業のエンジニア採用事情
NuxtJS + SSRで作ったGREE Tech Conference 2020
NuxtJS + SSRで作ったGREE Tech Conference 2020
【19-B-1】情シスの中のアーキテクト ~ソフトウェアアーキテクチャを超えて~
【19-B-1】情シスの中のアーキテクト ~ソフトウェアアーキテクチャを超えて~
翻訳QAでのテスト自動化の取り組み
翻訳QAでのテスト自動化の取り組み
信頼されるエンジニアへの貴重な一歩! テストのお勉強はどうやるの?
信頼されるエンジニアへの貴重な一歩! テストのお勉強はどうやるの?
20190117 teamup
20190117 teamup
Osashimi
Osashimi
ノーコードとアジャイル
ノーコードとアジャイル
事業成長にコミットするエンジニア組織への道のり
事業成長にコミットするエンジニア組織への道のり
DevOps時代の開発環境と現場体験 [#cmdevio2015]
DevOps時代の開発環境と現場体験 [#cmdevio2015]
Shinogi meetup online_20200729
Shinogi meetup online_20200729
kintone hack 真のファストシステムへ
kintone hack 真のファストシステムへ
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
[Observability conference 2022/3/11] NewsPicks のプロダクト開発エンジニアが実践するスキルとしての SRE
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
「やんちゃ、足りてる?」〜ヤンマガWebで挑戦を続ける新入りエンジニア〜
Meetup0729 xi leap
Meetup0729 xi leap
「失敗事例から学ぶアジャイル開発」研修の紹介
「失敗事例から学ぶアジャイル開発」研修の紹介
20171201_02_idb_security_wg発表_p
20171201_02_idb_security_wg発表_p
Viewers also liked
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
cyberagent
最新版Hadoopクラスタを運用して得られたもの
最新版Hadoopクラスタを運用して得られたもの
cyberagent
AbemaTV モバイルアプリの開発体制と開発プロセスの話
AbemaTV モバイルアプリの開発体制と開発プロセスの話
Yuji Hato
AbemaTV デザインのBefore & After
AbemaTV デザインのBefore & After
Shunsuke Matsumoto
Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
Kosetsu Tsukuda
広告プラットフォーム立ち上げ百鬼夜行
広告プラットフォーム立ち上げ百鬼夜行
Takahiro Ogoshi
Jap2017 ss65 優しいベイズ統計への導入法
Jap2017 ss65 優しいベイズ統計への導入法
考司 小杉
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
STAIR Lab, Chiba Institute of Technology
日本音響学会2017秋 ビギナーズセミナー "深層学習を深く学習するための基礎"
日本音響学会2017秋 ビギナーズセミナー "深層学習を深く学習するための基礎"
Shinnosuke Takamichi
VentureCafe_第2回:SIerでのキャリアパスを考える_ござ先輩発表資料 V1.0
VentureCafe_第2回:SIerでのキャリアパスを考える_ござ先輩発表資料 V1.0
Michitaka Yumoto
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
takehikoihayashi
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Cloudera Japan
Active Learning 入門
Active Learning 入門
Shuyo Nakatani
Jaccard係数の計算式と特徴(1)
Jaccard係数の計算式と特徴(1)
khcoder
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
shindannin
ミリシタを支える GAE/Go
ミリシタを支える GAE/Go
Google Cloud Platform - Japan
(DL hacks輪読)Bayesian Neural Network
(DL hacks輪読)Bayesian Neural Network
Masahiro Suzuki
If文から機械学習への道
If文から機械学習への道
nishio
シリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのか
Atsushi Nakada
Viewers also liked
(20)
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
最新版Hadoopクラスタを運用して得られたもの
最新版Hadoopクラスタを運用して得られたもの
AbemaTV モバイルアプリの開発体制と開発プロセスの話
AbemaTV モバイルアプリの開発体制と開発プロセスの話
AbemaTV デザインのBefore & After
AbemaTV デザインのBefore & After
Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
Lyric Jumper:アーティストごとの歌詞トピックの傾向に基づく歌詞探索サービス
広告プラットフォーム立ち上げ百鬼夜行
広告プラットフォーム立ち上げ百鬼夜行
Jap2017 ss65 優しいベイズ統計への導入法
Jap2017 ss65 優しいベイズ統計への導入法
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
日本音響学会2017秋 ビギナーズセミナー "深層学習を深く学習するための基礎"
日本音響学会2017秋 ビギナーズセミナー "深層学習を深く学習するための基礎"
VentureCafe_第2回:SIerでのキャリアパスを考える_ござ先輩発表資料 V1.0
VentureCafe_第2回:SIerでのキャリアパスを考える_ござ先輩発表資料 V1.0
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Active Learning 入門
Active Learning 入門
Jaccard係数の計算式と特徴(1)
Jaccard係数の計算式と特徴(1)
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
ミリシタを支える GAE/Go
ミリシタを支える GAE/Go
(DL hacks輪読)Bayesian Neural Network
(DL hacks輪読)Bayesian Neural Network
If文から機械学習への道
If文から機械学習への道
シリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのか
Similar to アドテクスタジオのデータ分析基盤について
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Atsushi Tsuchiya
AI Seed_サービス紹介資料.pdf
AI Seed_サービス紹介資料.pdf
ssuser29849a
組込みソフトウェア開発に対する弊社の取り組み事例
組込みソフトウェア開発に対する弊社の取り組み事例
ESM SEC
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Microsoft Azure Japan
株式会社サイバーエージェント アドテクスタジオの技術と開発
株式会社サイバーエージェント アドテクスタジオの技術と開発
Naoyuki Yamada
広告におけるビッグデータの分析事例
広告におけるビッグデータの分析事例
Ken Takao
エデュテックパートナーズのデジタル支援サービスのご案内
エデュテックパートナーズのデジタル支援サービスのご案内
munjapan
経営のアジリティを支えるDevOpsと組織
経営のアジリティを支えるDevOpsと組織
Recruit Technologies
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
知礼 八子
プロジェクト管理支援環境の高度化に向けた取り組み
プロジェクト管理支援環境の高度化に向けた取り組み
agileware_jp
事業共創ワークセッションのご案内
事業共創ワークセッションのご案内
Yuichiro KATO
ビー・テクノロジーの創業時の会社案内
ビー・テクノロジーの創業時の会社案内
Tsuyoshi Horigome
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
5W1Hで考えるCCoE.pptx
5W1Hで考えるCCoE.pptx
Tomoaki Tada
21 02-18 web seminar
21 02-18 web seminar
忍 寺門
Elastic Aquia Joint webinar-20211006
Elastic Aquia Joint webinar-20211006
Shotaro Suzuki
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
Cybozucommunity
Cloud Native and Agile Approach
Cloud Native and Agile Approach
Shinya Yanagihara
ファーストアカウンティング会社説明資料 for engineer 2022年7月版
ファーストアカウンティング会社説明資料 for engineer 2022年7月版
ファーストアカウンティング 採用担当
As1 company profile[1]
As1 company profile[1]
ssusere2833f
Similar to アドテクスタジオのデータ分析基盤について
(20)
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
AI Seed_サービス紹介資料.pdf
AI Seed_サービス紹介資料.pdf
組込みソフトウェア開発に対する弊社の取り組み事例
組込みソフトウェア開発に対する弊社の取り組み事例
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
Io taiプロジェクトの進め方、組織作り 20180208_ver1.02
株式会社サイバーエージェント アドテクスタジオの技術と開発
株式会社サイバーエージェント アドテクスタジオの技術と開発
広告におけるビッグデータの分析事例
広告におけるビッグデータの分析事例
エデュテックパートナーズのデジタル支援サービスのご案内
エデュテックパートナーズのデジタル支援サービスのご案内
経営のアジリティを支えるDevOpsと組織
経営のアジリティを支えるDevOpsと組織
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
プロジェクト管理支援環境の高度化に向けた取り組み
プロジェクト管理支援環境の高度化に向けた取り組み
事業共創ワークセッションのご案内
事業共創ワークセッションのご案内
ビー・テクノロジーの創業時の会社案内
ビー・テクノロジーの創業時の会社案内
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
5W1Hで考えるCCoE.pptx
5W1Hで考えるCCoE.pptx
21 02-18 web seminar
21 02-18 web seminar
Elastic Aquia Joint webinar-20211006
Elastic Aquia Joint webinar-20211006
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
Cloud Native and Agile Approach
Cloud Native and Agile Approach
ファーストアカウンティング会社説明資料 for engineer 2022年7月版
ファーストアカウンティング会社説明資料 for engineer 2022年7月版
As1 company profile[1]
As1 company profile[1]
アドテクスタジオのデータ分析基盤について
1.
アドテクスタジオの 分析基盤について 2017.09.22 @ Data
Engineering and Data Analysis Workshop #2
2.
自己紹介 サイバーエージェント アドテク本部 AIStudio Devグループ 伊藤
和宏 2011年中途入社。広告の効果計測、DMP関連の開発、運 用。データ分析基盤の構築に従事。
3.
アドテクスタジオとは サイバーエージェントグループのアドテクノロジー分野における サービス開発を行うエンジニアの横断組織です。 当社では、アドテクノロジー分野におけるサービスを多数提供しています。 これまでは、各子会社を通じサービス開発をしていましたが、 開発効率の向上、各サービスの技術力および精度強化を目的に、 アドテクノロジーにかかわるサービスの開発部門の横断組織として、 「アドテクスタジオ」を設立しました。開発体制を強化するほか、 エンジニアの技術力向上をサポートする環境づくりや、 新たな制度の導入などを行っています。
4.
● アドテクスタジオの分析基盤とは ● 課題 ●
なぜ分析基盤を作ったのか ● 今後について 内容
5.
アドテクスタジオの分析基盤とは
6.
アドテクスタジオの分析基盤とは ・アドテクスタジオのメンバーが使いたい 時に使いたい人がいつでも分析できる環 境を提供
7.
アドテクスタジオの分析基盤とは 何を提供しているのか?
8.
アドテクスタジオの分析基盤とは 何を提供しているのか? ・Notebook(Jupyter)
9.
アドテクスタジオの分析基盤とは 何を提供しているのか? ・Notebook(Jupyter) ・Actian Matrix(高速DWH)
10.
アドテクスタジオの分析基盤とは 何を提供しているのか? ・Notebook(Jupyter) ・Actian Matrix(高速DWH) ・OpenStack Sahara(Hadoop)
11.
アドテクスタジオの分析基盤とは 何を提供しているのか? ・Notebook(Jupyter) ・Actian Matrix(高速DWH) ・OpenStack Sahara(Hadoop) ・Notebook共有(NBViewer)
12.
アドテクスタジオの分析基盤とは 何を提供しているのか? ・Notebook(Jupyter) ・Actian Matrix(高速DWH) ・OpenStack Sahara(Hadoop) ・Notebook共有(NBViewer) ・データ
13.
アドテクスタジオの分析基盤とは 何を提供しているのか? ・Notebook(Jupyter) ・Actian Matrix(高速DWH) ・OpenStack Sahara(Hadoop) ・Notebook共有(NBViewer) ・データ (所属しているプロダクトのデータがHadoopに接続)
14.
アドテクスタジオの分析基盤とは 認証は社内認証システムと連動 ・分析基盤のアカウントなどの申請不要 ・所属プロダクトのデータにアクセス可能 ・HDFS(プロダクトの蓄積データ) ・ActianMatrix ・Sahara
15.
アドテクスタジオの分析基盤とは
16.
アドテクスタジオの分析基盤とは Notebookからプロダクトが蓄積した データにHadoop経由でアクセスする ことが可能。 データをMatrixに入れて高速にクエリ ーを実行して集計することが可能。 作成したソースコードや実行結果 (ipynb)を共有することが可能
17.
AR Ganesha(Sahara) DC/OS Marathon Sahara ActianMatrix HDFS Hadoop Cluster Meta Marathon LB Marathon LB UI Hadoop
Cluster NBServer NBViewer Notebook Notebook Notebook Notebook pynb
18.
アドテクスタジオの分析基盤とは Ganesha(データ蓄積)
19.
アドテクスタジオの分析基盤とは Ganesha(データ蓄積) ・各プロダクトのログを収集。 オンプレ、AWS、GCPに対応
20.
アドテクスタジオの分析基盤とは Ganesha(データ蓄積) ・各プロダクトのログを収集。 オンプレ、AWS、GCPに対応 ・プロダクトごとにアクセス制限を設定
21.
AR DC/OS Sahara GCP AWS Kinesis Kinesis-Kafka Bridge HDFS Streamer S3 Kafka S3-Kafka Bridge FluentD Pub/Sub GCS External Storage Converter Master Loader Schema Registry Data Catalog Workflow Engine Notebook Frontend Pubsub-Kafka Bridge
22.
アドテクスタジオの分析基盤とは Ganeshaのデータ量 ・全体データ量:約1.3PB
23.
アドテクスタジオの分析基盤とは サーバ ・Sahara:全体CPU:4600core、メモリ:24TB ・Matrix:CPU:8core×2、メモリ:684GB、SSD:1.6TB×24 × 10台 ・DCOS:CPU:48core、メモリ:157GB、SSD:1.5TB
× 5台
24.
課題
25.
課題 これだけコストのかかった環境。 課題は多い。。
26.
課題 ・使ってくれない。。。
27.
課題 ・使ってくれない。。。 ・そういうものがあるということを知らなかった
28.
課題 ・使ってくれない。。。 ・そういうものがあるということを知らなかった ・既に自分たちで用意しているので、今更移行などが面倒。
29.
課題 ・使ってくれない。。。 ・そういうものがあるということを知らなかった ・既に自分たちで用意しているので、今更移行などが面倒。 ・データがすぐに利用できない ・Hiveで取り込んだデータを利用する際、CreateTableが必要。 ・さらに時間ごとにデータパスが変わるので、パーティション追加が必要。
30.
課題 ・使ってくれない。。。 ・そういうものがあるということを知らなかった ・既に自分たちで用意しているので、今更移行などが面倒。 ・データがすぐに利用できない ・Hiveで取り込んだデータを利用する際、CreateTableが必要。 ・さらに時間ごとにデータパスが変わるので、パーティション追加が必要。 ・分析結果など他のシステムに連携できない。
31.
課題 ・使ってくれない。。。 ・そういうものがあるということを知らなかった ・既に自分たちで用意しているので、今更移行などが面倒。 ・データがすぐに利用できない ・Hiveで取り込んだデータを利用する際、CreateTableが必要。 ・さらに時間ごとにデータパスが変わるので、パーティション追加が必要。 ・分析結果など他のシステムに連携できない。 ・Notebookのコンテナを落とすと初期状態
32.
対策
33.
対策 ・そういうものがあるということを知らなかった ・周知する ・既に自分たちで用意している ・使いやすい方を使えばいいと思う。 ・要望があれば検討。 ・データがすぐに利用できない ・CreateTableやパーティションを自動的に追加 ・分析結果などを他のシステムに連携できない ・データ転送する仕組みの追加
34.
対策 徐々にユーザやプロダクト側が利用しはじめる。
35.
課題
36.
課題 ・リソース不足
37.
課題 ・リソース不足 ・ユーザがNotebookのコンテナを止めない
38.
課題 ・リソース不足 ・ユーザがNotebookのコンテナを止めない ・プロダクトごとにSaharaクラスタを作ったら足りなくなった。
39.
対策
40.
対策 ・リソース不足 使う時にリソースを確保するような仕組みにしたい。
41.
対策 ・リソース不足 使う時にリソースを確保するような仕組みにしたい。 ・プロダクトごとのSaharaクラスタを廃止。 全プロダクトが利用できる共有クラスタを作成
42.
対策 ・リソース不足 使う時にリソースを確保するような仕組みにしたい。 ・プロダクトごとのSaharaクラスタを廃止。 全プロダクトが利用できる共有クラスタを作成 ・ユーザごとにDockerイメージを作成。 アドテクスタジオ内のartifactoryに保存。 Notebookが利用されていない時はコンテナを落とす。
43.
課題 課題と対策を繰り返しながら、 運用を継続中
44.
課題 膨大なコストをかけてる割には、 結果が出ていないのではないか
45.
なぜ分析基盤を作ったのか
46.
なぜ分析基盤を作ったのか ・プロダクトがそれぞれ分析環境を作るのなら、共通基 盤として作ろう。
47.
なぜ分析基盤を作ったのか ・プロダクトがそれぞれ分析環境を作るのなら、共通基 盤として作ろう。 ・不正メディアや不正ユーザなどを検知するにはすべて のプロダクトのデータが必要。
48.
なぜ分析基盤を作ったのか ・プロダクトがそれぞれ分析環境を作るのなら、共通基 盤として作ろう。 ・不正メディアや不正ユーザなどを検知するにはすべて のプロダクトのデータが必要。 ・1つのプロダクトのデータを分析するだけで効果をあ げられるのか?
49.
なぜ分析基盤を作ったのか ・プロダクトがそれぞれ分析環境を作るのなら、共通基 盤として作ろう。 ・不正メディアや不正ユーザなどを検知するにはすべて のプロダクトのデータが必要。 ・1つのプロダクトのデータを分析するだけで効果をあ げられるのか? ・新規で配信プロダクトを作った時に既存のデータを使 えるといいよね。
50.
なぜ分析基盤を作ったのか ・プロダクトごとにデータを利用するだけではなく、ア ドテクスタジオの膨大なデータを利用できる環境。
51.
なぜ分析基盤を作ったのか ・プロダクトごとにデータを利用するだけではなく、ア ドテクスタジオの膨大なデータを利用できる環境。 ※ただし、データポリシーを遵守してプロダクトの許可 が得られた時のみ。 無断で使われないようセキュリティも重要
52.
なぜ分析基盤を作ったのか アドテクスタジオのデータが研究や不正対策などに利用 され始めています。 今後、大きな成果が出ることを期待して分析環境を運用 と改善をしながら進めていきます。
53.
今後について
54.
今後について ・ユーザごとにDockerイメージをカスタマイズ ・プロダクト側へのデータ転送(AWS,GCP)
55.
今後について ・ユーザごとにDockerイメージをカスタマイズ ・プロダクト側へのデータ転送(AWS,GCP) ・クリエイティブなどの画像や動画の収集と分析環境
56.
ご清聴ありがとうございました。
Download now