SlideShare a Scribd company logo
1 of 28
めざせスカウター!
HoloLensによる特定個人の
顔認識アプリ制作とその課題
ABC2017 Spring
MR/VRトラック(4201 T5)
16:30 ~ 16:55
東京工業大学 情報理工学院 数理計算科学系
岩崎謙汰 高橋良希
目次
• 自己紹介
• 今回作りたかったモノ
• ARとMRの違い、MR開発の難しさ
• Basic idea
• アプリの全体像
• まとめ
自己紹介
• 東京工業大学 M2 岩崎謙汰
• 研究:SNSのグラフサンプリング
• 趣味:電車で30分プログラミング
先週作ったゲーム3本
• Unityエンジニア/クライアント側担当
• AR/MR開発で楽しく暮らしたい
自己紹介
• 東京工業大学 M1 高橋良希
• 研究:分散機械学習
• 趣味:Caffeによる画像認識アプリ開発
Raspberry Piアプリ開発
• サーバー側担当
今回作りたかったモノ
出典 wayohoo.net
スカウター
出典: http://sekkachi.blog.jp/archives/1039744030.html
相手の戦闘力などの情報を
レンズ(?)のUI上に表示する
スカウター作りたい!
と思い立つ。しかし…
出典: http://eiga.com/movie/83224/
オーグマーすげー!
超かっこいい!作りたい!
めざせスカウター!
HoloLensによる特定個人の
顔認識アプリ制作とその課題
東京工業大学 情報理工学院 数理計算科学系
岩崎謙汰 高橋良希
オーグマー!
ABC2017 Spring
MR/VRトラック(4201 T5)
16:30 ~ 16:55
人の頭上に名前を表示する
アプリを制作する
目標
出典: http://www.matolabel.net/archives/68231429.html
出典 http://anicul.jp/saogekijyouos/
人の頭上に
名前を表示
リアルと関連づいた3D空間上に配置する
人の頭上に名前を表示する
アプリを制作する
今回のポイント
3D空間上に配置する2DのUI上ではなく
ARとMR
今回こっち!
3D空間に仮想オブジェクトを配置する方法
• ARマーカーを使用する (Vuforiaなど)
→ 人間の顔をマーカーにするのは難しい
• 仮想空間上に現実と同じ部屋&物のモデルを配置する
→ めちゃくちゃ大変 & 汎用性が低い
• HoloLensのジェスチャーで配置する
→ 実際コレが多い気がする、しかし今回は自動でやりたい
• GPSから場所を推定する
→ 全ての人間/物体がGPSを持っているわけでは…
3D空間に仮想オブジェクトを配置する方法
• ARマーカーを使用する (Vuforiaなど)
→ 人間の顔をマーカーにするのは難しい
• 仮想空間上に現実と同じ部屋&物のモデルを配置する
→ めちゃくちゃ大変 & 汎用性が低い
• HoloLensのジェスチャーで配置する
→ 実際コレが多い気がする、しかし自動でやりたい
• GPSから場所を推定する
→ 全ての人間/物体がGPSを持っているわけでは…
意外と難しい!
なぜ難しい? HoloLensが見ている世界
2D (画像) 3D
解析のしやすさ 解析しやすい 当たり判定のみ
奥行きの判定 わかりにくい わかる
どちらも見ている
人間どれ?
どれくらい
遠くにいる?
噛み合せ
たい!
解決策: 顔の中心の座標に向けてRayを飛ばす
出典: http://tsubakit1.hateblo.jp/entry/2017/02/22/230100
画像解析でクラス名と
顔の中心の座標を取得
Ex)クラス名: yoshiki
顔の中心の標: (600,300)
顔の中心の座標へ
Rayを飛ばす
この衝突点は
yoshikiだとわかる
yoshiki
デモ
考察
• 概ね、頭の上に移動しようとしている…?
• 認識できるのは研究室メンバーのみだが、
顔認識の精度は改善の余地あり。
• 被写体が動くと頭の上から外れやすい。
• もっとなめらかに動かしたいが、
これ以上早くしようとするとアプリが落ちる。
(現在 HTTP通信とSpatialMappingの更新頻度を
1秒に1回にしている)
アプリの全体像
HoloLens 被写体
① Webカメラから
画像を取得
サーバー
③ OpenCVで顔の中心の座標の取得
④ Deep Learningによる識別
⑥ 顔の中心の座標に
Rayを飛ばし、
頭上の座標を推定
⑦ 3D空間上にラベルを表示
出典: http://tsubakit1.hateblo.jp/entry/2017/02/22/230100
yoshiki
HoloLensから画像をサーバーに送る
• HoloLens側は画像撮って送って返ってきた情報を載せ
るだけにしたい!
• WebCameraから画像を取得する
• HTTP通信で画像をサーバーに送る
↑普段のUnityの書き方と同じ
↓HoloLens特有設定
• Capabilitiesチェックを忘れない
学習用研究室メンバの画像収集
学生室
枚
数
研究室メンバ
205枚タグ付け
Raspberry Pi
による自動収集
ん?少ない人がいるぞ?
バックエンド処理
人間がタグ付け
学習済みモデル
HTTP通信
画像出典:https://www.raspberrypi.org/, https://www.microsoft.com/ja-jp/hololens
学習
アプリケーション
名前
確率
Deep Learning
による識別
OpenCVによる顔検出
(顔の中心座標計算)
座標
Caffe
学習
205枚x
6クラス
820枚x
6クラス
Neural Network (Alex net)
Pre-trained
Network
回転・ぼかしに
よる増強
精度変化
まとめ
• 人の頭の上に研究室メンバーの名前を表示するアプリを
制作した。
• MR開発で大事なこと
→リアル世界の認知と3D空間上の配置をどう組み立てるか
• ハードウェアの進歩が先か、エンジニアのアイデアが先か
• MR開発これからも楽しんでいきたいです!
補足説明
• 今回使用した技術など
• HoloLens開発: Windows10, Unity5.6.0
• サーバーサイド: Python
• DeepLearnig: Caffe

More Related Content

What's hot

ピクサー USD 入門 新たなコンテンツパイプラインを構築する
ピクサー USD 入門 新たなコンテンツパイプラインを構築するピクサー USD 入門 新たなコンテンツパイプラインを構築する
ピクサー USD 入門 新たなコンテンツパイプラインを構築する
Takahito Tejima
 

What's hot (20)

HoloLens 2を手に入れたらとりあえず試しておくべきアプリ
HoloLens 2を手に入れたらとりあえず試しておくべきアプリHoloLens 2を手に入れたらとりあえず試しておくべきアプリ
HoloLens 2を手に入れたらとりあえず試しておくべきアプリ
 
HoloLensでPhotonを使ってみる(とりあえず動くか編)
HoloLensでPhotonを使ってみる(とりあえず動くか編)HoloLensでPhotonを使ってみる(とりあえず動くか編)
HoloLensでPhotonを使ってみる(とりあえず動くか編)
 
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
 
ピクサー USD 入門 新たなコンテンツパイプラインを構築する
ピクサー USD 入門 新たなコンテンツパイプラインを構築するピクサー USD 入門 新たなコンテンツパイプラインを構築する
ピクサー USD 入門 新たなコンテンツパイプラインを構築する
 
【Unity】 Behavior TreeでAIを作る
 【Unity】 Behavior TreeでAIを作る 【Unity】 Behavior TreeでAIを作る
【Unity】 Behavior TreeでAIを作る
 
CEDEC2016: Unreal Engine 4 のレンダリングフロー総おさらい
CEDEC2016: Unreal Engine 4 のレンダリングフロー総おさらいCEDEC2016: Unreal Engine 4 のレンダリングフロー総おさらい
CEDEC2016: Unreal Engine 4 のレンダリングフロー総おさらい
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
 
MVPパターンによる設計アプローチ「あなたのアプリ報連相できてますか」
MVPパターンによる設計アプローチ「あなたのアプリ報連相できてますか」MVPパターンによる設計アプローチ「あなたのアプリ報連相できてますか」
MVPパターンによる設計アプローチ「あなたのアプリ報連相できてますか」
 
オープンソース SLAM の分類
オープンソース SLAM の分類オープンソース SLAM の分類
オープンソース SLAM の分類
 
HoloLensで音声認識をする方法を色々試してみた
HoloLensで音声認識をする方法を色々試してみたHoloLensで音声認識をする方法を色々試してみた
HoloLensで音声認識をする方法を色々試してみた
 
【Unite Tokyo 2019】SRPで一から描画フローを作ってみた! ~Unity描画フローからの脱却~
【Unite Tokyo 2019】SRPで一から描画フローを作ってみた! ~Unity描画フローからの脱却~【Unite Tokyo 2019】SRPで一から描画フローを作ってみた! ~Unity描画フローからの脱却~
【Unite Tokyo 2019】SRPで一から描画フローを作ってみた! ~Unity描画フローからの脱却~
 
猫でも分かるUE4のポストプロセスを使った演出・絵作り
猫でも分かるUE4のポストプロセスを使った演出・絵作り猫でも分かるUE4のポストプロセスを使った演出・絵作り
猫でも分かるUE4のポストプロセスを使った演出・絵作り
 
Teslaにおけるコンピュータビジョン技術の調査
Teslaにおけるコンピュータビジョン技術の調査Teslaにおけるコンピュータビジョン技術の調査
Teslaにおけるコンピュータビジョン技術の調査
 
フィーチャモデルの描き方
フィーチャモデルの描き方フィーチャモデルの描き方
フィーチャモデルの描き方
 
【Unite Tokyo 2018】トゥーンシェーダートークセッション#1『リアルタイムトゥーンシェーダー徹底トーク』
【Unite Tokyo 2018】トゥーンシェーダートークセッション#1『リアルタイムトゥーンシェーダー徹底トーク』【Unite Tokyo 2018】トゥーンシェーダートークセッション#1『リアルタイムトゥーンシェーダー徹底トーク』
【Unite Tokyo 2018】トゥーンシェーダートークセッション#1『リアルタイムトゥーンシェーダー徹底トーク』
 
見よう見まねでやってみる2D流体シミュレーション
見よう見まねでやってみる2D流体シミュレーション見よう見まねでやってみる2D流体シミュレーション
見よう見まねでやってみる2D流体シミュレーション
 
5分で入門するAzure PlayFab
5分で入門するAzure PlayFab5分で入門するAzure PlayFab
5分で入門するAzure PlayFab
 
UnityによるHoloLensアプリケーション入門
UnityによるHoloLensアプリケーション入門UnityによるHoloLensアプリケーション入門
UnityによるHoloLensアプリケーション入門
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築
 

Similar to めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題

Similar to めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題 (20)

H3第40回「ヘルスケアVR超入門」
H3第40回「ヘルスケアVR超入門」H3第40回「ヘルスケアVR超入門」
H3第40回「ヘルスケアVR超入門」
 
Aiをアプリに取り込む!
Aiをアプリに取り込む!Aiをアプリに取り込む!
Aiをアプリに取り込む!
 
A06  角田研究室6 長谷川和紀
A06  角田研究室6 長谷川和紀A06  角田研究室6 長谷川和紀
A06  角田研究室6 長谷川和紀
 
横浜での「まちを考える仕事」って?
横浜での「まちを考える仕事」って?横浜での「まちを考える仕事」って?
横浜での「まちを考える仕事」って?
 
【QRコードアーティストの自立戦略 ~ UX/UIデザインワークショップ】
【QRコードアーティストの自立戦略 ~ UX/UIデザインワークショップ】【QRコードアーティストの自立戦略 ~ UX/UIデザインワークショップ】
【QRコードアーティストの自立戦略 ~ UX/UIデザインワークショップ】
 
CasperJSを使って任意のWebサイトを電子書籍化する方法
CasperJSを使って任意のWebサイトを電子書籍化する方法CasperJSを使って任意のWebサイトを電子書籍化する方法
CasperJSを使って任意のWebサイトを電子書籍化する方法
 
Code for Kanazawa / Code for Japan Meeting in OSAKA
Code for Kanazawa / Code for Japan Meeting in OSAKA Code for Kanazawa / Code for Japan Meeting in OSAKA
Code for Kanazawa / Code for Japan Meeting in OSAKA
 
岡山スマホアプリ開発もくもく会 #oso2016
岡山スマホアプリ開発もくもく会 #oso2016岡山スマホアプリ開発もくもく会 #oso2016
岡山スマホアプリ開発もくもく会 #oso2016
 
Scratchを使ったビジュアルプログラミング
Scratchを使ったビジュアルプログラミングScratchを使ったビジュアルプログラミング
Scratchを使ったビジュアルプログラミング
 
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
We Are Humor Beings: Understanding and Predicting Visual Humor (関東CV勉強会 CVPR ...
 
モバイルアプリ開発未経験でJavaもKotlinも触ったことがない人とFluxアーキテクチャでAndroidアプリ開発する話
モバイルアプリ開発未経験でJavaもKotlinも触ったことがない人とFluxアーキテクチャでAndroidアプリ開発する話モバイルアプリ開発未経験でJavaもKotlinも触ったことがない人とFluxアーキテクチャでAndroidアプリ開発する話
モバイルアプリ開発未経験でJavaもKotlinも触ったことがない人とFluxアーキテクチャでAndroidアプリ開発する話
 
Size class_yucovin_collabotips01
Size class_yucovin_collabotips01Size class_yucovin_collabotips01
Size class_yucovin_collabotips01
 
Shinyを自由に使ってみる​
Shinyを自由に使ってみる​Shinyを自由に使ってみる​
Shinyを自由に使ってみる​
 
Quantum computer applications in serverless architecture and challenges
Quantum computer applications in serverless architecture and challengesQuantum computer applications in serverless architecture and challenges
Quantum computer applications in serverless architecture and challenges
 
普段こういうこと気にしながら、こんな風に作ってます。
普段こういうこと気にしながら、こんな風に作ってます。普段こういうこと気にしながら、こんな風に作ってます。
普段こういうこと気にしながら、こんな風に作ってます。
 
AIの見方、AIとの付き合い方
AIの見方、AIとの付き合い方AIの見方、AIとの付き合い方
AIの見方、AIとの付き合い方
 
勉強会用スライド
勉強会用スライド勉強会用スライド
勉強会用スライド
 
ロボコンの為のFusion360講座 #CAD編
ロボコンの為のFusion360講座 #CAD編ロボコンの為のFusion360講座 #CAD編
ロボコンの為のFusion360講座 #CAD編
 
Custom Visionで仏像を画像分類
Custom Visionで仏像を画像分類Custom Visionで仏像を画像分類
Custom Visionで仏像を画像分類
 
【Unity道場教育スペシャル】4年制大学の教育・研究におけるUnityの活用
【Unity道場教育スペシャル】4年制大学の教育・研究におけるUnityの活用【Unity道場教育スペシャル】4年制大学の教育・研究におけるUnityの活用
【Unity道場教育スペシャル】4年制大学の教育・研究におけるUnityの活用
 

めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題

Editor's Notes

  1. 同じく....高橋と申します. 大学の研究内容は...ですが,今回スカウター作成では深層学習で顔認識をするバックエンド側の開発を行いました.これまでにもCaffeを使った画像認識webクローラを作ったり,ラズパイとウェブカメラを組み合わせた画像収集や画像処理をおこなったりしています.
  2. 深層学習ではまず学習する画像データ集めます.ラズパイとウェブカメラを組み合わせて