SlideShare a Scribd company logo
1 of 91
Download to read offline
©2017 Toyota InfoTechnology Center Co., Ltd.
ポストAIを見据えた日本企業の経営戦略
デジタルテクノロジーの進化がもたらすクルマの付加価値向上
加藤 整
2017年10月20日
会津IT秋フォーラム2017 1
https://commons.wikimedia.org/wiki/File:Neuronal_activity_DARPA.jpg
©2017 Toyota InfoTechnology Center Co., Ltd.
IBMに入社後10年間、一貫して数理科学の実世界応用へ
•2002年に東大院数理を卒業、日本IBMへ入社
•もともとは高次元カオス(非線形力学系)の研究をしていました
•それ以来10年、様々なプロジェクトに「数理科学」技術で取り組んできました。
•03-05 情報システムの性能に関する研究
•06-07 システム障害リスクに関する研究
•07-12 マルチエージェントシステムの研究
•その後
•12-14 IBMの戦略コンサル部門で活躍
•14-17 トヨタIT開発センターで調査・企画部門のグループリーダ担当
会津IT秋フォーラム2017 2
©2017 Toyota InfoTechnology Center Co., Ltd.
未来の交通社会のために、京都大学と日本IBMが
共同で大規模交通シミュレータを開発しました。
京都大学との共同研究 報道発表
•プレスリリース
•IBM Research and Kyoto University Create First of a Kind System to
Simulate Urban Transportation" 10 Jun 2008 (in the States)
•“未来の交通社会をシミュレーション-数百万台規模の多様で
広範囲な都市交通をミクロに再現する交通シミュレーター”,
2008年6月10日
•新聞報道
• 「交通状況 ミクロに予測」日刊工業新聞, 2008年6月11日(水)朝刊
•「車数百万台個別に再現」,日経産業新聞, 2008年6月11日(水)朝刊
•「交通シミュレート技術日本IBMと京大,共同開発」,フジサンケイビジネスアイ, 2008年6月11日(水)朝刊
•「都市交通シミュレータ開発CO2排出量予測も」化学工業日報,2008年6月12日(水)朝刊
•「IBMと京都大学,新方式の交通シミュレーション・システムを共同開発」,ITPro,2008年6月10日
•「高齢社会の交通問題も予測可能に:京大とIBMが共同研究」,未来の都市交通をシミュレーション,ITmedia,2008年6月10日
•「日本IBMと京都大学が共同で交通シミュレーションを開発」,マイコミジャーナル,2008年6月10日
•「京大と日本IBM,大規模交通社会シミュレーションシステムを開発」,PC Watch,2008年6月11日
•雑誌
•CO2激減!「人とクルマ」の新たな関係,プレジデント 2009年1.12号
•IBM 広告
•Op-ad #3: SMART TRAFFIC, Nov. 2008 (in the States)
•「スマート」な交通システム,日経新聞2009年3月2日
•テレビCM
•in the end June, 2009 (in Japan)
https://www.youtube.com/watch?v=LlAbKHiaaac
会津IT秋フォーラム2017 3
TV CM出演を逃す;_;
©2017 Toyota InfoTechnology Center Co., Ltd.
2045年に人工知能は人間の能力を超えるか?
会津IT秋フォーラム2017 4
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 5
出典:AAAI2017@Hilton San Francisco Union Squareにて加藤撮影
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 6出典:AAAI2017@Hilton San Francisco Union Squareにて加藤撮影。写真右は加藤の左脚
©2017 Toyota InfoTechnology Center Co., Ltd.
シンギュラリティ
技術的特異点
会津IT秋フォーラム2017 7
©2017 Toyota InfoTechnology Center Co., Ltd.
シンギュラリティ
技術的特異点
会津IT秋フォーラム2017 8
1. 人間が計算機に支配される
2. 肉体を失い、計算機の中で生きる
3. 肉体は存続、知能強化/義体化
4. 何も起こらない
©2017 Toyota InfoTechnology Center Co., Ltd.
クルマを取り巻くメガトレンド
2030年には京コンピュータレベルの計算機性能を持つ車載MMが搭載、クルマが感情を持って、
運転者と対話できるようになる?
会津IT秋フォーラム2017
2010 2020 2030 2040
シンギュラリティ
計算機
エージェント
/人工知能
医療
クルマ
ニューロモフィック
不揮発性ストレージメモリ
10 TBメモリ(1000ドル)
マインドアップローディング
医療用ナノマシン 記憶用脳ナノボット
全脳シミュレーション
出典:The Singularity Is Near: When Humans Transcend Biology などを元にITC作成. 計算機性能は各種資料よりITC算出
ポストブレイン
仮想現実で人生の
半分を過ごす
9
脳-クルマインターフェース
感情を持つクルマ
1.2Z FLOPS
(スパコン)
0.6Y FLOPS
(スパコン)
10P FLOPS
(スパコン)
45P FLOPS
(パーソナル)
1E FLOPS
(パーソナル)
2.3E FLOPS
(スパコン)
京が車載MMに
ポスト京が
車載MMに
1. 人間が計算機に支配される
2. 肉体を失い、計算機の中で生きる
3. 肉体は存続、知能強化/義体化
4. 何も起こらない
1. クルマ開発サイクル半減
2. 肉体を失い、移動不要
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 10
ポスト・ヒューマン?
https://www.youtube.com/watch?v=3Fm0Zirt8wI
https://inhabitat.com/cyberdyne-unveils-mind-controlled-robot-exoskeleton-that-protects-fukushima-workers-from-nuclear-radiation/
https://matome.naver.jp/odai/2140193243282307701
©2017 Toyota InfoTechnology Center Co., Ltd.
現在の人工知能とその限界
会津IT秋フォーラム2017 11
人間の能力を超えた機能 機械では未だできないこと
Alex Krizhevsky et al., "ImageNet Classification with Deep Convolutional Neural Networks," NIPS 2012
Courtesy of DeepMind. Courtesy of International Business Machines Corporation.
http://www.drropra.com/understanding-practice-dynamic/
https://www.linkedin.com/pulse/20140820165325-19360894-secret-to-success-ask-the-right-question/
Inspiration Asking Right Question
忖度 空気を読む
©2017 Toyota InfoTechnology Center Co., Ltd.
本日のゴール
会津IT秋フォーラム2017 12
AIの仕組みをもう1段深く理解して、深いレベルまで俯瞰しよう
→ ケース: 自動運転車、深層学習、自然言語処理
その限界や意義を見極め、AI導入の投資対効果を涼しい頭で考えよう
(ルールベースの方が現実問題上手くいっている場合もあります)
(大規模な学習データ獲得のコストやオペレーションコストもかかります)
経営的視点から現実を理解しよう
©2017 Toyota InfoTechnology Center Co., Ltd.
ケース1
完全自動運転は実現するか?
会津IT秋フォーラム2017 13
©2017 Toyota InfoTechnology Center Co., Ltd.
本日のゴール
14
Stanford Junior、Google Car、Autoware†など自律型自動運転システムに関する
公開情報を基に自律型自動運転システムを構成する要素技術の概要を具体的に理解する
†http://www.pdsl.jp/fot/autoware/
本発表は私個人の見解であり、所属する組織やグループ企業の立場、戦略、意見を代表するものではありません
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
問題:これらのイノベーションの共通点は?
15
https://en.wikipedia.org/wiki/Internet,https://en.wikipedia.org/wiki/Global_Positioning_System,
https://en.wikipedia.org/wiki/Autonomous_car, https://ja.wikipedia.org/wiki/IPhone_4S
GPS
インターネット Siri
自動運転車
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd. 16http://www.darpa.mil/ 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
DARPA概要
DARPAはスプートニクショックを受けて58年に設立以来、多くのイノベーションへ貢献してきている
17
ソ連、スプートニク1号
打ち上げ成功
1957年
高等研究計画局
設立
1958年
ARPANET
1969年
1978年
GPS
DARPA Grand Challenge
2004,2005年
2007年
DARPA Urban Challenge
https://en.wikipedia.org/wiki/Sputnik_1, https://en.wikipedia.org/wiki/DARPA, https://en.wikipedia.org/wiki/ARPANET
https://en.wikipedia.org/wiki/Global_Positioning_System, http://archive.darpa.mil/grandchallenge04/
http://archive.darpa.mil/grandchallenge/index.html, https://en.wikipedia.org/wiki/DARPA_Robotics_Challenge
https://cgc.darpa.mil/
Robotics Challenge
2012-15年
2014-2015年
Cyber Grand Challenge
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd. 18https://www.ted.com/talks/sebastian_thrun_google_s_driverless_car?language=en 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd. 19
1. 基礎
1. 緒言
2. 再帰的状態推定
3. ガウシアンフィルタ
4. ノンパラメトリックフィルタ
5. ロボットの動作
6. ロボットの知覚
2. ローカライゼーション
1. ロボットの位置推定
2. 移動ロボットのいち推定
3. 地図生成
1. 占有格子地図の生成
2. 姿勢と地図の同時推定
3. GraphSLAMアルゴリズム
4. 疎拡張情報フィルタ
5. FastSLAMアルゴリズム
4. 計画と制御
1. マルコフ決定過程
2. 部分観測マルコフ決定過程
3. POMDPの近似手法
4. 探査
https://images-na.ssl-images-amazon.com/images/I/51oedehWUdL._SX440_BO1,204,203,200_.jpg
目次は、上田訳、確率ロボティックス,2007 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd. 20
DGC 2005,
スタンフォード大学 Stanley優勝
DGC 2007
スタンフォード大学 Junior準優勝
https://en.wikipedia.org/wiki/Stanley_(vehicle), http://archive.darpa.mil/grandchallenge/gallery.html
https://www.youtube.com/watch?v=bDOnn0-4Nq8, https://www.udacity.com/
S. Thrun et al., Stanley, the robot that won the DARPA Grand Challenge, Journal of Field Robotics, 2006
M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008
2011,オンライン教育機関Udacity設立
2009
Google Self-Driving Cars
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 21出典:AAAI2017@Hilton San Francisco Union Squareにて加藤撮影
©2017 Toyota InfoTechnology Center Co., Ltd.
DARPA Urban Challenge 2007
DARPAはオフロードにおける軍事作戦を想定した2004年2005年のGrand Challengeに続き、
市街戦を想定したUrban Challengeを2007年に実施
22
Why develop autonomous vehicles?
The National Defense Authorization Act for Fiscal Year 2001, Public Law 106-398,
Congress mandated in Section 220 that “It shall be a goal of the Armed Forces to
achieve the fielding of unmanned, remotely controlled technology such that… by 2015,
one-third of the operational ground combat vehicles are unmanned.” DARPA conducts
the Urban Challenge program in support of this Congressional mandate. Every “dull,
dirty, or dangerous” task that can be carried out using a machine instead of a
human protects our warfighters and allows valuable human resources to be
used more effectively.
http://archive.darpa.mil/grandchallenge/docs/Urban_Challenge_Team_Welcome_Meeting.pdf 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
DARPA Urban Challenge 2007コースレイアウト
エリアA(交差点左折、交通への流入)、エリアB(ナビ、駐車)、エリアC(交差点通過、Uターン)の
3つのエリアからなる
23http://archive.darpa.mil/grandchallenge/docs/Urban_Challenge_Team_Welcome_Meeting.pdf 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
DARPA Urban Challenge 2007レギュレーション
市街戦を想定しながらも、カルフォルニア州の交通規則に従わないとマイナス点をつけられるなど
市街地走行に必要な安全性も要求
24
http://archive.darpa.mil/grandchallenge/docs/Urban_Challenge_Team_Welcome_Meeting.pdf,
保坂ら、自動運転 システム構成と要素技術,2015
• 直前に与えられたミッションに従った走行計画生成
• カルフォルニア州の交通規則に従った走行
• 複数の自動車とプロドライバが運転する30台の手動運転者が混在して走行する環境で安全に走行
• 州者スペースから他車両が走行する道路への合流
• ラウンドアバウトの通過
• 4方向一時停止交差点における到着順に応じた発信による交差点通過
• 交差点における信号・標識に応じtあ停止、発進
• 対向車料など他車両とのタイミングを調整した右左折
• 停止車両や障害物を避けての通過
• 対向2車線道路におけるUターン
• 制限速度を認識して速度調整
• 軽目られた駐車場で駐車スペースを探索して駐車
以下の課題をクリアしながら約60マイル(97km)を6時間以内に走行。
各テスト車の後ろを追跡者が走行、危険な状態になった場合にはリ
モコンで緊急停止。約100箇所のチェックポイントで、交通規則を守っ
ているかを確認し、採点
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
DARPA Urban Challenge 2007の結果
89台のチームが応募、準決勝を通過した11チーム中、6チームがチェッカーフラグを受ける。
優勝はTatan Racing、$2Mを獲得
25http://archive.darpa.mil/grandchallenge/gallery.html
1位: CMU
4:10:20
2位: Stanford
4:29:28
3位: Virginia Tech.
4:36:38
5位: U. Penn.
> 6hours
6位: Cornell
> 6 hours
4位: MIT
Approx 6 hours
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd. 26
Applanix INSVelodyne laserRiegl laser SICK LMS laser
SICK LDLRS laserDMIIBEO laserBOSCH Radar
LiDAR
GNSS/慣性走行装置
ミリ波レーダー
走行距離計
6軸慣性センサは搭載せず
M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
Juniorにおけるソフトウェアフローダイアグラム
センサー、位置推定モジュール、物体検出モジュール、UKF姿勢推定モジュール、軌道生成器等からなる
27M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
DARPA Urban Challenge 2007の意義
Googleによる自律型自動運転システムへの研究開発に引続き、2013年以降自動車会社や
部品会社から自動運転システムの発表が相次ぐ
28
路車協調方式
http://www.path.berkeley.edu/publications/general-publications, https://www.youtube.com/watch?v=7Yd9Ij0INX0
自律走行型
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自律走行型自動運転システムを構築する要素技術
自律走行型自動運転システムを構築する要素のうち、太文字について続く頁にて説明する
29
経路計画
軌道生成
SLAM
自己位置推定
物体検出
経路追従
車両制御
地図生成
必要な技術処理内容
高精度3次元地図の生成
認知
判断
操作
フェーズ
LIDAR, GNSS, カメラを搭載した車両を走らせ、点群
データを収集。点群データから高精度3次元地図を
作成
スキャンデータと、前述の3次元地図データが重な
るようスキャンマッチング、地図内の位置、向きを
算出(自己位置推定)。他の車両や信号等物体検
出
スタートからゴールまでの大まかな経路に従い、車
両の運動特性を考慮してすぐ近くまでの滑らかな
経路を生成(経路生成)。各経路のコストを計算し、
経路を選択
生成された経路を追従するための速度、角速度を
車両に伝達
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
地図生成
車両にGPS とレーザスキャナ,カメラを搭載し,移動しながら三次元環境を復元するモービルマッピング
システムにより地図を生成
30
モバイルマッピングシステム[1]
[1]石川ら、モービルマッピングシステムによる都市空間モデリング、計測自動制御学会産業論文集、2009
高精度3次元地図
ポイントクラウド地図
• 3次元座標(緯度経度標高)
• RGB値
ADAS地図
• ポイントクラウド地図から地物を抽出
• 信号、路面標示等
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
3次元LIDAR
パルス状に発行するレーザー照射に対応する散乱光を測定することにより距離や、反射強度を測定する
装置
31
可動部の有無 メカレス型 メカニカルスキャン型
走査方式 光フェーズドアレイレー
ダー
MEMSミラーによるスキャ
ン
モーター駆動ミラーによるスキャン
ビームフォーミング MEMSミラー 水平回転ポリゴンミラーの各面でピッチ角を
変更
複数素子による多層
化
電磁駆動共振ミラー
主な企業 Quanergy Systems 日本信号、パイオニア等 豊田中央研究所等 Velodyne、Valeo、コニ
カミノルタ
北陽電気
価格 数万円 数万~数十万円 数十万円 数十万-数百万円 数十万円
レーザーを対象物に照射し、散乱光を測定することにより、対象物までの距
離や反射強度を取得。下図はVelodyne HDL-64e(測定距離100-120m, 垂直
視野26.8°、測定ポイント数1333000ポイント/秒
HDL-64e Uer's manual, Nikkei Robotics, 2016,
GPU Technology Conference, Solid State LiDAR for Ubiquitous 3D Sensing
Quanergy Systems社が採用するフェーズドアレー方式では従来の機構的な可
動部が不要になるため、低コスト化と小型化が期待される。写真はQuanergy
Systems社のS3。
受光部 送信部
LSI
60mm
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自己位置推定
自己位置推定とSLAM手法は大きく3つに分類される
32
自己位置推定
位置追従
大域的位置推定
(誘拐ロボット問題)
内界
センサデータ
外界
センサデータ
地図
自己位置
地図生成
既知の姿勢に
基づく地図生成
地図
外界
センサデータ
自己位置
姿勢と地図の
同時推定
(SLAM)
内界
センサデータ
外界
センサデータ
自己位置
地図
+
=
スキャンマッチン
グ
ベイズフィルタ グラフベース
SLAM
性質 オンライン オンライン オフライン
概要 環境計測の点群
を最小化計算で
位置合わせ
制御動作に依る
事前確率と環境
計測による尤度
を確率的に融合
各時刻のロボット
位置や地図のラ
ンドマーク位置の
関係をグラフを制
約条件として最
適化
推定の出力 現在のロボット位
置を点推定
現在のロボット位
置と地図を確率
分布として推定
移動軌跡や地図
のランドマーク位
置を点推定
手法の例 ICP, NDT等 EKF, PF等 完全SLAM等
m2
x0
x1
x2
x3
m1
移動
観測
情報行列Ω に移動や観測のデータ
をどんどん追加 Ωからロボットの軌
跡を最適化で求める
Ω:情報行列 = Σ-1
グラフベースSLAM
次頁以降で説明
原、自己位置推定・地図生成(SLAM)の全体像, Nikkei Robotics、2016 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自己位置推定 スキャンマッチング(1/2)
モバイルマッピングシステムで作成したポイントクラウド地図と自社がLIDARで計測したスキャン結果
を合わせ込むことで位置合わせを行う
33
ポイントクラウド地図 ポイントクラウド地図
スキャン結果
スキャンマッチングして
推定された位置
T : 車両の同次変換作用素(回転R+並進Tr) 𝑇∗
= argmin
𝑇
𝑘=1
𝐾
||𝑚 𝑘 − 𝑇 ∙ 𝑑 𝑘||
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自己位置推定 スキャンマッチング(2/2)
スキャンマッチングには点対点で評価するICPと、点対分布で評価するNDPが一般的に用いられる
34
Iterative Closest Points(ICP)[1] Normal Distributions Transform(NDP)[2]
• 最近傍点間の距離の2乗和を最小化
• 計算量はO(MN)
• 地図空間を正規分布で近似、入力スキャン
の対応要素をニュートン法で探索
• 計算量はO(N)
[1]P.J. Besl and N.D. McKay. A method for registration of 3d shapes. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1992.
[2]P. Biber and W. Straber: The normal distributions transform:a new approach to laser scanmatching,
Proc. of the 2003 IEEE/RSJ International Conference on Intelligent Robots and Systems, 2003
𝐸 𝑇 =
𝑖=1
𝑀
𝑗=1
𝑁
𝑤𝑖𝑗 ||𝑚𝑖 − 𝑇 ∙ 𝑑𝑗 ||
𝑤𝑖𝑗 = 1 (𝑖と𝑗が対応点)
=0 (𝑖と𝑗が対応点でない)
ポイントクラウド地図{𝑑𝑗}
𝐸 𝑇 =
𝑗 𝑖=1
𝑛
𝑝(𝑇 ∙ 𝑑𝑖)
j=1 j=2
𝑝(𝒙) =
1
Σ
exp(−
(𝒙−𝒒) 𝑇Σ−1(𝒙−𝒒)
2
)
n はボクセルの数含まれるdiの数
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自己位置推定 ベイズフィルタ
制御動作による予測位置を計測結果の情報を使って更新する
35
𝑓 𝑥 𝑦 =
1
𝑓(𝑦)
× 𝑓 𝑦 𝑥 𝑓 𝑥 = 𝜂 𝑓 𝑦 𝑥 𝑓(𝑥)
ベイズの定理
f (x)がデータY=y を観測する前のX の確率分布とすると
f (x|y)は、データY の観測値y を得た後のデータXの確率
分布と解釈される
データの観測を通じて事前のより不確かな信念が事
後のより確かな信念に変化
上田訳、確率ロボティックス, https://en.wikipedia.org/wiki/Thomas_Bayes
𝑝 𝑥 𝑡|𝑢1:𝑡, 𝑧1:𝑡 = 𝜂 𝑝 𝑧𝑡 𝑥 𝑡, 𝑢1:𝑡 𝑝(𝑥 𝑡 |𝑧1:𝑡−1, , 𝑢1:𝑡)
= 𝜂 𝑝 𝑧𝑡 𝑥 𝑡, 𝑢1:𝑡 𝑝(𝑥 𝑡 |𝑥 𝑡−1, , 𝑢 𝑡)𝑝 𝑥 𝑡−1 𝑢1:𝑡−1 , 𝑧1:𝑡−1 𝑑𝑥 𝑡−1
信念分布を正規分布で表現→KF, EKF,
ノンパラベイズ → PF
ポイントクラウド地図:m
ロボット位置:𝑥 𝑡−1
制御動作:𝑢 𝑡
推定位置:𝑇(𝑢 𝑡)𝑥 𝑡−1
真の位置:𝑥 𝑡
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自動運転システムでの自動走行までの流れ
駐車計画等も含めた起点終点情報から大まかな経路計画を立て、それに沿って軌道を生成、障害物
回避等を折り込みながら最終的な次の時間ステップの目標速度、目標加速度を車両に伝達
36
Hybrid-state A* Search [1] 他
Pure Pursuit Path Tracking Algorithm[2]
PIDコントロール
他
[1] D. Dolgov, Practical Search Techniques in Path Planning for Autonomous Driving
[2] R. Craig Conlter, Implementation of the Pure Pursuit Path Tracking Algorithm, CMU-RI-TR-92-0
経路計画
速度、角速度を車両へ伝達
軌道生成
経路追従
State Lattice Planner 他
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
軌道生成
現在姿勢と目標姿勢を繋ぐ曲線を生成、各曲線の評価関数を設定、安全な軌道を選択
37M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008
横方向のオフセット
を設けた目標姿勢
軌道の曲率を考慮し、
車両が走行可能な
軌道を生成
生成した各軌道について評価関数を算出、
安全な軌道を選択
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
ピュアパス追跡アルゴリズム
ピュアパス追跡アルゴリズムにより、目標経路を実現する、目標速度と目標角速度が求まる
38R. Craig Conlter, Implementation of the Pure Pursuit Path Tracking Algorithm, CMU-RI-TR-92-0
x
y
(x ,y)
r
l
dx
y
𝑥2
+ 𝑦2
= 𝑙2
𝑥 + 𝑑 = 𝑟
𝑦2 + 𝑑2 = 𝑟2
𝜅 =
2𝑥
𝑙2
⟹
x
y
l
look ahead distance
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
車両制御
Loodahead Distanceを適切に設定することにより、乗り心地のいい滑らかな運転を実現。
最終的に求まる目標速度と目標角速度を車両の送信
39[1]R. Craig Conlter, Implementation of the Pure Pursuit Path 'hcking Algorithm, CMU-RI-TR-92-0
lookhaed distanceの値によって車両の曲がり易さが変わる[1]
𝜔 𝑡 = 𝑣𝑐 𝜅
𝜅 =
2𝑥
𝑙2
𝑣 𝑡
𝜔 𝑡
l が小さい
l が大きい
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
自動運転レベルの確認
NIT
SA
NITSA
における
呼称
NITSAにおける定義 SAE SAEにおける
呼称
SAEにおける定義 ハンドル操作
と加速/減速
の実行主体
走行環境の
モニタリング
運転操作の
バックアップ主体
システム能力
(運転モード)
0 自動化な
し
常時、ドライバーが、運転の
制御(操舵、制動、加
速)を行う
0 手動 ドライバが、常時、全ての運転操作を行う ドライバ ドライバ ドライバ
1 特定機能
の自動化
操舵、制動又は加速の支
援を行うが操舵・制動・加
速の全てを支援しない
1 補助 運転支援システムが走行環境に応じたハンドル操作、あるい
は、加減速のいずれかを行うとともに、システムが補助をしてい
ない部分の運転操作をドライバが行う
ドライバ+シ
ステム
ドライバ ドライバ いくつかの
運転モード
2 複合機能
の自動化
ドライバーは安全運行の責
任を持つが、操舵・制動・加
速全ての運転支援を行う
2 部分的な
自動化
運転支援システムが走行環境に応じたハンドル操作と加減速
を行うとともに、システムが補助をしていない部分の
運転操作をドライバが行う
システム ドライバ ドライバ いくつかの
運転モード
3 半自動運
転
機能限界になった場合のみ、
運転者が自ら運転操作を
行う
3 条件付き
自動化
システムからの運転操作切り替え要請にドライバーは適切に
応じるという条件のもと、特定の運転モードにおいて自
動化された運転システムが車両の運転操作を行う。
システム システム ドライバ いくつかの
運転モード
4 完全自動
運転
運転操作、周辺監視を全
てシステムに委ねるシステム
4 高度な自動化 システムからの運転操作切り替え要請にドライバーが適切に応
じなかった場合でも、特定の運転モードにおいて自動化された
運転システムが車両の運転操作を行う。
システム システム システム いくつかの
運転モード
5 完全自動化 ドライバでも対応可能ないかなる道路や走行環境条件のもと
でも、自動化された運転システムが、常時、車両の運転操作
を行う
システム システム システム 全ての
運転モード
出所:第5回オートパイロットシステムに関する検討会、http://www.mlit.go.jp/road/ir/ir-council/autopilot/pdf/05/2.pdf を元にIT開発センター作成 40会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
(参考情報)
SheridenとInagakiは、人と機械の協調形態を表現する概念を11の自動化レベルで定義することを提案
レベル Sheriden, Inagakiの自動化レベルの定義
1 コンピュ-タの支援なしに,すべてを人間が決定・実行
2 コンピュ-タはすべての選択肢を提示し,人間はそのうちのひとつを選択して実行
3 コンピュ-タは可能な選択肢をすべて人間に提示するとともに,その中のひとつを選んで提案.それを実行するか否かは人間が決定
4 コンピュ-タは可能な選択肢の中からひとつを選び,それを人間に提案.それを実行するか否かは人間が決定
5 コンピュ-タはひとつの案を人間に提示.人間が了承すれば,コンピュ-タが実行
6 コンピュ-タはひとつの案を人間に提示.人間が一定時間以内に実行中止を指令しない限り,コンピュ-タはその案を実行
6.5 コンピュ-タはひとつの案を人間に提示すると同時に、その案を実行
7 コンピュ-タがすべてを行い,何を実行したか人間に報告
8 コンピュ-タがすべてを決定・実行.人間に問われれば,何を実行したか人間に報告
9 コンピュ-タがすべてを決定・実行.何を実行したか人間に報告するのは,必要性をコンピュ-タが認めたときのみ
10 コンピュ-タがすべてを決定し,実行
出所: T.B.Sheridan, Telerobotics, Automation, and Human Supervisory Control. MIT Press, 1992.
T.Inagaki, et al, “Trust, self-confidence and authority in human-machine systems,” Proc. IFAC HMS, 1998. 41会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
10年後には、世界の自動車の出荷台数の2割がLV2の自動運転車と予測されている
9147000
12091000
49848000
34420000
2350000023000
3600000
19800000
31550000
138000
3610000
9798000
706000
0
10000000
20000000
30000000
40000000
50000000
60000000
70000000
2014 2015 2020 2025 2030
LV1 LV2 LV3 LV4
自動運転車のレベル別世界市場規模予測(搭載車両出荷台数ベース)、単位台
予測
出所: 日刊自動車新聞、2015年7月22日 42会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
(参考情報)
戦略的イノベーション創造プログラム(SIP)では、一般道/自動車専用道でのLV2の開発実証を2018年、自動車
専用道でのLV3を2020年、LV4を2030年としている
戦略的イノベーション創造プログラム(SIP)における自動走行システムロードマップ
出所:内閣府、SIP(戦略的イノベーション創造プログラム)自動走行システム研究開発計画 2015年5月21日 43会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
(参考情報)
自動運転車実現のパスには、発展/革命/変革の3つのパスがあると考えられる
44出所:Sven Beiker, "Different Paths toward automated driving", Jan. 15, 2015 より転載 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
まとめ
•DARPA Grand Challenge/DARPA Urban Challengeを通じて、ロボティックス技術が自動運転
システムへ。自動車会社より2013年頃から乗用車の自動運転システムの発表相次ぐ
•自動運転システムの基本的な構成は
•センサー:LIDAR、ミリ波レダー、GNSS、DMI、IMU、カメラ
•制御システム:認知モジュール、判断モジュール、操作モジュール
•大量データ処理、運転時例外処理の学習、高精度地図等情報処理技術の担う役割が一層増しつつ
ある
•特に大量の自動運転システム搭載車が走り回る際のサイバー空間としての地図整備への期待が高い
45会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
ケース2
深層学習ブームの次にくるのは?
会津IT秋フォーラム2017 46
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 47Courtesy of DeepMind.
©2017 Toyota InfoTechnology Center Co., Ltd.
D. Silver et al. Mastering the game of Go without human knowledge. Nature. Vol 550, October 19,
2017, p. 354. doi: 10.1038/nature24270.
会津IT秋フォーラム2017 48
https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
https://deepmind.com/blog/alphago-zero-learning-scratch/
©2017 Toyota InfoTechnology Center Co., Ltd.
DeepMindは2017年10月18日、自己対局のみでスキルアップする新囲碁AI
"Alpha Go Zero"を発表。40日間で柯潔を破ったAlpha Go Masterに完勝
会津IT秋フォーラム2017 49
https://deepmind.com/blog/alphago-zero-learning-scratch/
https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
©2017 Toyota InfoTechnology Center Co., Ltd.
人工知能とは
人工知能とは、人工的にコンピュータ上などで人間と同様の知能を実現させよう
という試み。最近注目を浴びているディープラーニングは機械学習の要素技術の1つ
50
人工知能
人工的にコンピュータ上などで人間と同様の知能を実現させようという試み
機械学習
人間が行っている学習の能力と同様の機能を計算機で実現しようとする試み
ニューラルネット
脳機能に見られる特性を計算機上で表現した数学モデル
ディープラーニング(深層学習)
多層構造のニューラルネットワーク
Wikipedia記事を元にIT開発センター作成 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
機械学習とは
機械学習とは人間が行っている学習の能力と同様の機能を計算機で実現しようとする試み
51
入力 出力
制限速70km/h
歩行者有り
左折以外外進行禁止
直進以外外進行禁止
訓
練
時
...
運
用
時
制限速60km/h
入力 出力
学習データセット
標識画像はGerman Traffic Sign Detection Benchmark (GTSDB)より
計算機
計算機
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
機械学習の技術動向
機械学習業界では、深層学習研究の割合が増えつつ有る
52各年のNIPS採択論文タイトルより用語を含む件数を数え上げ、その年の採択論文数で除算して比率をITC算出, https://papers.nips.cc/
0%
10%
20%
30%
40%
50%
1987 1995 2000 2005 2010 2015
Neural SVM, kernel Deep Convex Submod
ニューラルネット全盛の時代
機械学習全盛の時代
深層学習が盛り上がる
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
ニューラルネットワークの基本計算
1層目のi 番目の入力 u1i に重み 𝑤1𝑗𝑖 をかけて足し合わせた後に、活性化関数f をかけて出力する
53
......
入
力
デ
ー
タ
出
力
デ
ー
タ
l=1 l=2 l=Ll=3
u1
(1)
𝑢𝑗
(2)
=
𝑖=1
𝐼
𝑤𝑗𝑖
(2)
𝑧𝑖
(1)
+ 𝑏𝑗
𝑧𝑗
(2)
= 𝑓(𝑢𝑗
(2)
)
𝑓(𝑢) = max(𝑢, 0)
𝒖(𝑙+1) = 𝑾(𝑙+1) 𝒛(𝑙) + 𝒃(𝑙+1)
𝒛(𝑙+1)
= 𝑓(𝒖(𝑙+1)
)
回帰の場合
訓練データセット
𝑥1, 𝑑1 , 𝑥2, 𝑑2 , … , 𝑥 𝑁, 𝑑 𝑁
𝐸 𝒘 =
1
2
𝑛=1
𝑁
| 𝐝 − 𝐲 𝒙 𝒏; 𝒘 | 𝟐
誤差関数
最適なパラーメタ
𝒘∗
= argmin
𝒘
𝐸(𝒘)
誤差関数が小さくなるように重みw を調整
→誤差逆伝播法
式(1)
uI
(1)
uJ
(2)
u1
(2)
表記は、岡谷、深層学習、2015による 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
誤差逆伝播法
誤差を最小化するための各層の重みはのずらし方は、出力層から入力層に向かって逆方向に算出するこ
とができる
54
第l-1層のユニットiと第l層のユニットjを繋ぐ結合の重みwji
(l)に関する微
分は、微分の連鎖規則より
となる。ここで右辺第2項は、前頁の式(1)より、簡単に
𝜕𝑢𝑗
(𝑙)
𝜕𝑤𝑗𝑖
(𝑙)
= 𝑧𝑖
(𝑙−1)
と求まる。但し此処で、式(1)の定数項については、重みがbj
(l)のユニッ
トが追加されていると見做している。
右辺第1項について、uj
(l) の変動がE に与える影響は、第l+1層の各
ユニットkの入力uk
(l+1) を変化こと以外では発生しないことが判る。即
ち、
𝜕𝐸
𝜕𝑢 𝑗
(𝑙) = 𝑘
𝜕𝐸
𝜕𝑢 𝑘
(𝑙+1)
𝜕𝑢 𝑘
(𝑙+1)
𝜕𝑢 𝑗
(𝑙) . 式(3)
𝜕𝐸
𝜕𝑤𝑗𝑖
(𝑙)
=
𝜕𝐸
𝜕𝑢𝑗
(𝑙)
𝜕𝑢𝑗
(𝑙)
𝜕𝑤𝑗𝑖
(𝑙)
式(2)
と表すと、式(2)は最終的に、
𝜕𝐸
𝜕𝑤𝑗𝑖
(𝑙)
= 𝛿𝑗
(𝑙)
𝑧𝑖
(𝑙−1)
𝛿𝑗
(𝑙)
= 𝑘 𝛿 𝑘
(𝑙+1)
wkj
(l+1) f ′ (uj
(l) )
式(3)の右辺第2項は、簡単にwkj
(l+1) f ' (uj
(l) ) となるから、
𝛿𝑗
(𝑙)
≝
𝜕𝐸
𝜕𝑢𝑗
(𝑙)
l-1 l l+1
u1
(1)
uI
(1)
𝛿𝑗
(𝑙)
𝛿1
(𝑙+1)
𝛿 𝑘
(𝑙+1)
𝛿 𝑘+1
(𝑙+1)
⋮
j
i
k
𝑧𝑖
(𝑙−1)
𝑘
図:誤差逆伝播の様子。𝛿𝑗
(𝑙)
は層l+1の𝛿𝑗
(𝑙+1)
が与えられれば計算可能
表記は、岡谷、深層学習、2015による 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
深層学習の概要
2000年後半以降、多層ニューラルネットの学習が可能になり、また各種ベンチマークで深層学習
の有効性が認知されるようになる
55
「浅い」ニューラルネット 「深い」ニューラルネット
......
「浅い」ニューラルネット 「深い」ニューラルネット (多層ニューラルネット)
入
力
デ
ー
タ
出
力
デ
ー
タ
入
力
デ
ー
タ
出
力
デ
ー
タ
• 2000年前半までは、多層ニューラルネットの学習が困難であった(勾配消失問題)
• 各層毎に事前に学習し初期パラメータを与えることで多層ニューラルネットの学習ができることが確認(事前学習)
• GPUやマルチコアCPUといった計算機能力が飛躍的に向上し、またウェブ上の充分な量のデータセットが集約
• 音声認識や画像認識のベンチマークテストで過去の記録が次々に塗り替えられことで有効性が認知
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
深層学習の概要
深層学習は、音声認識、画像解析、物体認識など幅広い分野で活用されつつある技術領域
56
適用エリア 適用アプリケーション
モバイル 音声対話
音声認識
Web レコメンデーションエンジン
ビデオ検索
自然言語処理
画像解析
自動翻訳
自動車 一般物体認識
高精度地図生成
画像解析
ロボット、ゲーム 強化学習
金融 フィンテック
深層学習の適用エリア
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
深層学習適用事例(1/3)
一般物体認識タスクでは、人間の精度よりも高い認識精度を達成した
57
容易
困難
物体カテゴリ識別
(Categorization)
物体検出
(Detection)
物体領域抽出
(Semantic segmentation)
一般物体認識の主要なタスク LSVRC(1000クラス物体識別タスク)のエラー率の推移
28
26
16
12
6.6 5.98 5.1 4.94 4.82
0
5
10
15
20
25
30
8層のCNNにより2位以下に
10%以上の差をつけてトロント
大学Hintonのチームが大勝
2012年のブレークスルー以降2
年で人間の精度を越す
エラー率(%)
人間の認識精度
中山、"深層畳み込みニューラルネットワークによる画像特徴抽出と転移学習"を基にITC作成 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
深層学習適用事例(2/3)
ロボットの分野では、深層学習により、ロボットが自動的に学習していけるようになりつつある
58
Deep Q Network
• ニューラルネットでQ関数を近似するアプローチQ-Networkgaが提案されていたが、多層なネットワークで上手く学習/収束が行えな
い、計算が遅い、実現しうる操作のシークエンスはほぼ無限通りあり、その中でバラバラなサンプリング試行を繰り返すと、学習結果の
パラメータが振動したり発散したりする、などの問題があり、実際に性能が示される実装は行われていなかった。
• DQNでは、学習データセットをミニバッチ更新することでこの学習の不安定性を解消
BRETT
(Berkely Robot for the
elimination of tedious tasks)
PFN
CES2016ぶつからないクルマ
V. Mnih, "Playing Atari with Deep Reinforcement Learning", https://youtu.be/JeVppkoloXs、PFN画像はCES2016にて加藤が撮影 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
深層学習適用事例(3/3)
画像解析の分野では、画像からその概念を機械が理解できるようになりつつある
59
図の内容を正しくキャ
プション生成
図と全く関係のない
キャプションを生成
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
人工知能関連企業のグローバルの動き
北米ではグーグル、マイクロソフト、ヤフー、百度等のIT企業が人工知能系人材獲得に注力している
60
上段画像はNIPS2015にて加藤が撮影、解像度を下げて掲載
下段画像はhttps://twitter.com/hashtag/nips2015 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
プレイヤー相関図
基礎研究に従事するトロント大学モントリオール大学は多くの企業と連携、自動車分野でもAmazon
やCVGLとの連携あり
61
MIT
CSAIL
CBBM
機関内のAI関連組織
(部署、学科、ラボ等)
NYU
 NYU Center for Data
Science
 Center for neural
science
 ECE Department
過去に所属等兼務出資 提携・共同研究人名
University of Toront
IBM
大学・公的研究機関 大手企業 新興企業
Stanford
SAIL
Andrew
Ng
VICARIOUS
Baidu
DNN
research
Geoffrey
Hinton
DeepMind
Technology
Demis
Hassavis
FAIR
Yann
LeCun
University
Of
Montreal
MILA
Yoshua
Bengio
Atomwise
医薬品
Amazon
CVGL
NASA
BOSCH
Carnegie Mellon University
DARPA
提携?
自動車企業
NVIDIA
UC Barkley
人工知能プラットフォーム開発
Yahoo
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
最新技術動向(1/3)
物体検出から、画像キャプション生成/QA、画像概念へ
62
画像キャプション生成 画像概念へ画像QA
O. Vinyals et al., Show and Tell: A Neural Image Caption Generator, arXiv:1411.4555
K. Xu et al., Show, Attend and Tell: Neural Image Caption Generation with Visual Attention, arXiv:1502.03044
J. Andreas et al., Deep Compositional Question Answering with Neural Module Networks, arXiv:1511.02799
S. Antol et al., VQA: Visual Question Answering, arXiv:1505.00468
https://github.com/Newmu/dcgan_code
F. Sadeghi et al., VISALOGY: Answering Visual Analogy Questions, arXiv:1509.08075 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
最新技術動向(2/3)
知識記憶機構の構築
63
Memory Networks
(MemNN/MemN2N)
Neural GPU へNeural Turing Machine (NTM)
学習によりアルゴリズムを獲得文章を記憶、質問に回答 並列化
加算
乗算
1010+0111
0110*0101
S. Sukhbaatar et al., End-To-End Memory Networks, arXiv:1503.08895
A. Graves et al., Neural Turing Machines, arXiv:1410.5401
Łukasz Kaiser and Ilya Sutskever, Neural GPUs Learn Algorithms, arXiv:1511.08228 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
最新技術動向(3/3)
特徴的なタスクへの適用
64
画像自動生成
(入力画像をNNが鳥と認識するように誘導)
視線検知
画像自動生成
(コンテントとスタイルの相関最大化)
視覚バイアス
L.A. Gatys et al., A Neural Algorithm of Artistic Style, A Neural Algorithm of Artistic Style, arXiv:1508.06576
http://googleresearch.blogspot.jp/2015/06/inceptionism-going-deeper-into-neural.html
J. Wu et al., Galileo: Perceiving Physical Object Properties by Integrating a Physics Engine with Deep Learning, NIPS2015
C. Vondrick et al., Learning visual biases from human imagination, NIPS2015
A. Recasens et al., Where are they looking?, NIPS2015, https://arxiv.org/abs/1609.03499
モノの物理的特徴の推論
音声合成
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
GPUの基本的な構造
GPUの数千個のコアを活用し並列処理を行うことで、行列計算など演算密度の高い数値計算、機械学
習等画像処理以外に汎用的に利用(GPGPU)。開発フレームワークの例としてNVIDIA CUDAを説明
65
ホスト デバイ
ス
CPU
メインメモリ L2
NVLink
← PCI-E
ストリーミング
マルチプロセッ
サ
CUDAコア
(2000-4000個程度)
共有メモリ
レジスタ
CUDAにおける言語拡張GPUの基本的な構造
• 関数修飾子 ホストとデバイスのどちらで実行するかを指定
• __global__, __device__, __host__
• カーネル関数呼び出し
• kernel <<<grid,block>>>();
• grid: ブロックによるグリッドの次元とサイズ
• block: スレッドによるブロックの次元とサイズ
• dim3宣言 3次元ベクトルの整数型の宣言
• ホスト同期
• cudaMemcpy()
• cudaThreadSynchronize()
grid
block
thread
#include <stdio.h>
__global__ void helloFromGPU(){
printf("GPU¥n");
}
int main(int argc,char **argv){
printf("CPU¥n");
dim3 block(10,1);
dim3 grid(1,1);
helloFromGPU<<<grid,block>>>();
cudaDeviceReset();
}
CUDAによるプログラミング例
会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
ケース3
機械は人間の話を理解できるか?
会津IT秋フォーラム2017 66
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 67
Courtesy of International Business Machines Corporation.
https://www.youtube.com/watch?v=P18EdAKuC1U
©2017 Toyota InfoTechnology Center Co., Ltd.
機械が自然言語を理解するには?
John R. Firth(1890-1960)
"You shall know a word by the
company it keeps" (Firth)
似た文脈で出現する単語同士は
意味も似ている(分布仮説)
古典的手法
• 分布的意味表現(Distributional Semantic
Representations)
• 文脈中に現れる単語の共起頻度で表現
• 高次元、疎 → 計算コストがかかる
現代的手法
• 分散的意味表現(Distributed Semantic
Representations)
• 数千次元のベクトル空間中のベクトルとして表現する
• 低次元、密、word2vecが公開、安定、高速
• 深層学習ブームやチャットボットブームに相まって実用
特殊なケースでは両者は実は等価であることが
理論的、実験的に証明
P2-P7で説明
P8-P13で説明
会津IT秋フォーラム2017 68
©2017 Toyota InfoTechnology Center Co., Ltd.
問題: ??? に入る単語は何か?
S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA
会津IT秋フォーラム2017 69
©2017 Toyota InfoTechnology Center Co., Ltd.
問題: ??? に入る単語は何か?
S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA
会津IT秋フォーラム2017 70
©2017 Toyota InfoTechnology Center Co., Ltd.
正解は "dog"
単語集合V
文脈語集合 C
共起頻度行列
S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA
会津IT秋フォーラム2017 71
©2017 Toyota InfoTechnology Center Co., Ltd.
svdによる次元圧縮
|V| = |C | とすると、共起頻度行列のサイズは 1000000 x 1000000
但し、データサイズよりも、行列が疎である方が問題
→ 次元圧縮により、有効な次元を抽出
𝑀 = 𝑈 Σ 𝑉†
但し、ここでMは共起頻度行列(ランクr)、Uはユニタリ行列、Σは特異値を対角成分に持つ行列、
V†は、ユニタリ行列の随伴行列
d個の特異値で打ち切った対角行列 𝑀でΣ を近似すると、
単語ベクトルを𝑈Σで近似すると、次元を|V|からdへ圧縮できる
m x n m x m m x n n x n
𝑀 𝑀†
≃ 𝑈Σ (𝑈Σ)†
.
会津IT秋フォーラム2017 72
©2017 Toyota InfoTechnology Center Co., Ltd.
幾何学的解釈
類似度計測にはユークリッド距離よりも、特徴量空間のベクトルの成す角度が重要
S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA
会津IT秋フォーラム2017 73
©2017 Toyota InfoTechnology Center Co., Ltd.
[Mikolov et al., 2013]
Mikolov et al. , "Distributed Representations ofWords and Phrases and their Compositionality, " NIPS 2013
Mikolov et al., "Linguistic Regularities in Continuous SpaceWord Representations," Proceedings of NAACL-HLT 2013, pages 746–751,. Atlanta, Georgia, 9–14 June 2013会津IT秋フォーラム2017 74
©2017 Toyota InfoTechnology Center Co., Ltd.
スキップグラムモデル[1]
[1] Mikolov et al. , "Distributed Representations ofWords and Phrases and their Compositionality, " NIPS 2013
• 周辺単語を予測するように、単語ベクトルを学習するモデル
(対数双線形モデル)
• 周辺単語から周辺単語を予測するモデル
(連続バッグオブワーズ)も同時に提案)
• 高性能な実装がオープンソースで公開、更に、ベクトルの
加法構成性から大反響
• 単語w に対して文脈c が発生する条件付き確率 P(c|w)
の対数尤度を最大化する。但し、ここで、vw , vc, はそれぞれ、
単語wのベクトル、文脈cのベクトルを示す。
𝑃(𝑐|𝑤) =
exp(𝒗 𝑤∙𝒗 𝑐)
𝑐′∈𝒱 exp( 𝒗 𝑤∙𝒗 𝒄′)
会津IT秋フォーラム2017 75
©2017 Toyota InfoTechnology Center Co., Ltd.
負例サンプリングによる近似[1]
負例サンプリングによる手法は、自己相互情報量を利用したSVDと同じであることが判明 [2]
[1] Mikolov et al. , "Distributed Representations ofWords and Phrases and their Compositionality, " NIPS 2013
[2] O. Levy and Y. Goldberg, "Neural Word Embedding as Implicit Matrix Factorization," NIPS 2014
𝑃(𝑐|𝑤) =
exp(𝒗 𝑤∙𝒗 𝑐)
𝑐′∈𝒱 exp( 𝒗 𝑤∙𝒗 𝒄′)
百万個のコーパスについて
計算するのが大変
2つのモデリング
1. P(c|w) を2値分類(ロジスティクス回帰)でモデル化
2. 1つの学習事例毎に、ランダムに生成したk個の負例とを識別できるように学習
𝑃(𝑐|𝑤) ≃ σ(𝒗 𝑤∙𝒗 𝑐)
𝑐′∈Unigram 𝑘(𝒟)
𝜎(−𝒗 𝑤∙𝒗 𝒄′) k個のサンプリング
(20個程度)
シグモイド関数
会津IT秋フォーラム2017 76
©2017 Toyota InfoTechnology Center Co., Ltd.
word2vecによる実装とその使い方具体例
•実装がスレッドプログラミングによりチューニングされているので、CPUでも高速、安定的に動作
•公開後、エンジニアの間で大流行
会津IT秋フォーラム2017 77https://github.com/tmikolov/word2vec
©2017 Toyota InfoTechnology Center Co., Ltd.
アプリケーション1: 言語間の翻訳
英語 スペイン語
Mikolov et al. , "Exploiting Similarities among Languages for Machine Translation, " arXiv:1309.4168 会津IT秋フォーラム2017 78
©2017 Toyota InfoTechnology Center Co., Ltd.
アプリケーション2: 文章のベクトル表現
連続バッグオブワーズ
Le et al., "Distributed Representations of Sentences and Documents," arXiv:1405.4053
パラグラフベクトル
周辺単語(文脈)に加えて、文書固有のベクトルも単語予測に利用。文書分類精度向上
会津IT秋フォーラム2017 79
©2017 Toyota InfoTechnology Center Co., Ltd.
深層学習による可読な機械間コミュニケーション言語の創発
会津IT秋フォーラム2017 80
これまでの深層学習
ぶつからないように強化学習できるが、そのルール
が人間が理解できない
最新の研究(*)
機械が作成した画像についての説明文を機械が理解して
当てるというタスクにおいて、機械間で言語が創発
→機械間の効率的な言語を生成可能なことを示唆
*S. Havrylov et al., “Emergence of Language with Multi-agent Games: Learning to
communicate with sequences of symbols,” ICLR 2017 workshop submission
©2017 Toyota InfoTechnology Center Co., Ltd.
ポストAIを見据えた日本企業の経営戦略
会津IT秋フォーラム2017 81
©2017 Toyota InfoTechnology Center Co., Ltd.
「妄想しカタチにする力」("シン・ニホン" 安宅, 2017)
会津IT秋フォーラム2017 82
https://commons.wikimedia.org/wiki/File:Steve_Jobs_Headshot_2010-CROP.jpg
https://commons.wikimedia.org/wiki/File:Dragon_V2_unveiling,_Elon_Musk_(KSC-2014-2727).jpg
©2017 Toyota InfoTechnology Center Co., Ltd.
Hallis Labs, Kitt.ai, Kaggle等AIスタートアップのM&Aが続く
会津IT秋フォーラム2017 83https://www.cbinsights.com/research/top-acquirers-ai-startups-ma-timeline/
©2017 Toyota InfoTechnology Center Co., Ltd.
0 100 200 300 400 500 600 700
UnitedhealthGroup Inc
Home DepotInc
Comcast Corp
Walt Disney Co
Citigroup Inc
General Electric Co
Visa Inc
Anheuser-Busch InbevSa
Johnson & Johnson
Bank Of America Corp
Samsung Electronics Co Ltd
Jpmorgan Chase & Co
Wells Fargo & Co
Tencent Holdings Ltd
Berkshire Hathaway Inc
Facebook Inc
Microsoft Corp
Amazon.Com Inc
Alphabet Inc
Apple Inc
133
137
140
146
152
153
159
178
192
193
198
214
218
258
277
330
346
392
470
660
時価総額ランキング
そこに日本の姿はない
会津IT秋フォーラム2017 84
Change in market cap 2009-2017 ($bn)
出典: Bloomberg and PwC analysis を基に加藤作成
IT Company
©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 85NIPS2016@Centre Convencions Internacional Barcelona, Barcelona SPAIN にて加藤撮影
AI系国際会議
そこにも日本の姿はない
©2017 Toyota InfoTechnology Center Co., Ltd.
(再掲)人工知能関連企業のグローバルの動き
初任給2,000万円の世界
86
上段画像はNIPS2015にて加藤が撮影、解像度を下げて掲載
下段画像はhttps://twitter.com/hashtag/nips2015 会津IT秋フォーラム2017
©2017 Toyota InfoTechnology Center Co., Ltd.
日本企業へのヒント1: Go Global
会津IT秋フォーラム2017 87TRIにて加藤撮影
©2017 Toyota InfoTechnology Center Co., Ltd.
日本企業へのヒント2: ユーザエクスペリエンス
会津IT秋フォーラム2017 88
Uber画面を加藤撮影
Amazon 本社@シアトルにて加藤撮影
テクノロジー駆動の新しい圧倒的な体験
©2017 Toyota InfoTechnology Center Co., Ltd.
日本企業へのヒント3: ヴィジョナリー
会津IT秋フォーラム2017 89
トップ主導の経営者ヴィジョン構築 ミドル主導の技術者(PM)ヴィジョン構築
https://upload.wikimedia.org/wikipedia/commons/a/a4/Larry_Page_%28cropped%29.jpg
https://commons.wikimedia.org/wiki/File:Eric_Schmidt_at_the_37th_G8_Summit_in_Deauville_037_(crop).jpg
https://commons.wikimedia.org/wiki/Category:Sergey_Brin#/media/File:Sergey_Brin_Ted_2010.jpg
https://www.ncbi.nlm.nih.gov/books/NBK36337/
"DARPA's Approach to Innovation and Its Reflection in Industry "
Lawrence H. Dubois,SRI International
©2017 Toyota InfoTechnology Center Co., Ltd.
本日のまとめ
会津IT秋フォーラム2017 90
AIの仕組みをもう1段深く理解して、深いレベルまで俯瞰しよう
→ ケース: 自動運転車、深層学習、自然言語処理
その限界や意義を見極め、AI導入の投資対効果を涼しい頭で考えよう
(ルールベースの方が現実問題上手くいっている場合もあります)
(大規模な学習データ獲得のコストやオペレーションコストもかかります)
経営的視点から現実を理解しよう
©2017 Toyota InfoTechnology Center Co., Ltd. 91
ありがとうございました
会津IT秋フォーラム2017

More Related Content

What's hot

イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化
Osaka University
 
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
Natsutani Minoru
 

What's hot (15)

タクシー運行最適化を実現する機械学習システムの社会実装
タクシー運行最適化を実現する機械学習システムの社会実装タクシー運行最適化を実現する機械学習システムの社会実装
タクシー運行最適化を実現する機械学習システムの社会実装
 
クラウドの進化とメディア理解の発展
クラウドの進化とメディア理解の発展クラウドの進化とメディア理解の発展
クラウドの進化とメディア理解の発展
 
イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
ソフトウェアジャパン2018 ITフォーラムセッション(3)
ソフトウェアジャパン2018 ITフォーラムセッション(3)ソフトウェアジャパン2018 ITフォーラムセッション(3)
ソフトウェアジャパン2018 ITフォーラムセッション(3)
 
自作プログラミング言語の集い
自作プログラミング言語の集い自作プログラミング言語の集い
自作プログラミング言語の集い
 
Ai from-digital-transformation:ポエムなAI はもう終わりにしよう:クラウドによる市民革命とAIによる産業革命
Ai from-digital-transformation:ポエムなAI はもう終わりにしよう:クラウドによる市民革命とAIによる産業革命Ai from-digital-transformation:ポエムなAI はもう終わりにしよう:クラウドによる市民革命とAIによる産業革命
Ai from-digital-transformation:ポエムなAI はもう終わりにしよう:クラウドによる市民革命とAIによる産業革命
 
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
 
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話
 
デジタルテクノロジーの進化がもたらすクルマの付加価値向上 20151218
デジタルテクノロジーの進化がもたらすクルマの付加価値向上 20151218デジタルテクノロジーの進化がもたらすクルマの付加価値向上 20151218
デジタルテクノロジーの進化がもたらすクルマの付加価値向上 20151218
 
5th長崎QDGスペシャルセッション「「未来社会実現のためのデジタル・トランスフォーメーション(DX)  ~長崎県におけるAIやIoT等の先端技術の活用と...
5th長崎QDGスペシャルセッション「「未来社会実現のためのデジタル・トランスフォーメーション(DX)  ~長崎県におけるAIやIoT等の先端技術の活用と...5th長崎QDGスペシャルセッション「「未来社会実現のためのデジタル・トランスフォーメーション(DX)  ~長崎県におけるAIやIoT等の先端技術の活用と...
5th長崎QDGスペシャルセッション「「未来社会実現のためのデジタル・トランスフォーメーション(DX)  ~長崎県におけるAIやIoT等の先端技術の活用と...
 
11 shibuya
11 shibuya11 shibuya
11 shibuya
 
07 hori
07 hori07 hori
07 hori
 
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
 
くらしの足からMaaSを捉えなおす イントロダクション
くらしの足からMaaSを捉えなおす イントロダクションくらしの足からMaaSを捉えなおす イントロダクション
くらしの足からMaaSを捉えなおす イントロダクション
 

Similar to ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2

AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決
Osaka University
 

Similar to ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2 (20)

Smfl20201001
Smfl20201001Smfl20201001
Smfl20201001
 
【金融機関アクセラレータ参加ベンチャーと学ぶAI】クラウド×AIで機械学習の民主化を目指すナレコムAI
【金融機関アクセラレータ参加ベンチャーと学ぶAI】クラウド×AIで機械学習の民主化を目指すナレコムAI【金融機関アクセラレータ参加ベンチャーと学ぶAI】クラウド×AIで機械学習の民主化を目指すナレコムAI
【金融機関アクセラレータ参加ベンチャーと学ぶAI】クラウド×AIで機械学習の民主化を目指すナレコムAI
 
オートモーティブ事業におけるMLOps / ShibuyaSynapse #4
オートモーティブ事業におけるMLOps / ShibuyaSynapse #4オートモーティブ事業におけるMLOps / ShibuyaSynapse #4
オートモーティブ事業におけるMLOps / ShibuyaSynapse #4
 
【20170414みんなのAI】機械学習の民主化を促進するAI活用術
【20170414みんなのAI】機械学習の民主化を促進するAI活用術【20170414みんなのAI】機械学習の民主化を促進するAI活用術
【20170414みんなのAI】機械学習の民主化を促進するAI活用術
 
20180704 soracom digitalization_final
20180704 soracom digitalization_final20180704 soracom digitalization_final
20180704 soracom digitalization_final
 
AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決AiとIoTによる産業最適化と社会問題解決
AiとIoTによる産業最適化と社会問題解決
 
エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習
 
デブサミ2017【17-E-5】エンタープライズにおけるDevOpsの実態!Cloud Native Application Platformの選択
デブサミ2017【17-E-5】エンタープライズにおけるDevOpsの実態!Cloud Native Application Platformの選択デブサミ2017【17-E-5】エンタープライズにおけるDevOpsの実態!Cloud Native Application Platformの選択
デブサミ2017【17-E-5】エンタープライズにおけるDevOpsの実態!Cloud Native Application Platformの選択
 
第2回 北海道IoTビジネス共創ラボ 勉強会 共創がもたらすIoTビジネス活用
第2回 北海道IoTビジネス共創ラボ 勉強会 共創がもたらすIoTビジネス活用第2回 北海道IoTビジネス共創ラボ 勉強会 共創がもたらすIoTビジネス活用
第2回 北海道IoTビジネス共創ラボ 勉強会 共創がもたらすIoTビジネス活用
 
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
kintone Cafe Japan 2016: kintone x 機械学習で実現する簡単名刺管理
 
JTF2018 FIWARE x robot x IoT
JTF2018 FIWARE x robot x IoTJTF2018 FIWARE x robot x IoT
JTF2018 FIWARE x robot x IoT
 
AWSでの金融系システム構築・運用勘所
AWSでの金融系システム構築・運用勘所AWSでの金融系システム構築・運用勘所
AWSでの金融系システム構築・運用勘所
 
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
第2回すだちくん勉強会におけるIoT最新動向と題したプレゼン資料
 
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
 
Io t labo20180312pub
Io t labo20180312pubIo t labo20180312pub
Io t labo20180312pub
 
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
 
scrum_fest_osaka_2020
scrum_fest_osaka_2020scrum_fest_osaka_2020
scrum_fest_osaka_2020
 
要求開発アライアンス納涼会 LT (フロント開発)
要求開発アライアンス納涼会 LT (フロント開発)要求開発アライアンス納涼会 LT (フロント開発)
要求開発アライアンス納涼会 LT (フロント開発)
 
[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』
[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』
[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』
 
NRIセキュアが考える持続可能なID&アクセス管理基盤の実現
NRIセキュアが考える持続可能なID&アクセス管理基盤の実現NRIセキュアが考える持続可能なID&アクセス管理基盤の実現
NRIセキュアが考える持続可能なID&アクセス管理基盤の実現
 

ポストAiを見据えた日本企業の経営戦略 加藤整 20171020_v1.2

  • 1. ©2017 Toyota InfoTechnology Center Co., Ltd. ポストAIを見据えた日本企業の経営戦略 デジタルテクノロジーの進化がもたらすクルマの付加価値向上 加藤 整 2017年10月20日 会津IT秋フォーラム2017 1 https://commons.wikimedia.org/wiki/File:Neuronal_activity_DARPA.jpg
  • 2. ©2017 Toyota InfoTechnology Center Co., Ltd. IBMに入社後10年間、一貫して数理科学の実世界応用へ •2002年に東大院数理を卒業、日本IBMへ入社 •もともとは高次元カオス(非線形力学系)の研究をしていました •それ以来10年、様々なプロジェクトに「数理科学」技術で取り組んできました。 •03-05 情報システムの性能に関する研究 •06-07 システム障害リスクに関する研究 •07-12 マルチエージェントシステムの研究 •その後 •12-14 IBMの戦略コンサル部門で活躍 •14-17 トヨタIT開発センターで調査・企画部門のグループリーダ担当 会津IT秋フォーラム2017 2
  • 3. ©2017 Toyota InfoTechnology Center Co., Ltd. 未来の交通社会のために、京都大学と日本IBMが 共同で大規模交通シミュレータを開発しました。 京都大学との共同研究 報道発表 •プレスリリース •IBM Research and Kyoto University Create First of a Kind System to Simulate Urban Transportation" 10 Jun 2008 (in the States) •“未来の交通社会をシミュレーション-数百万台規模の多様で 広範囲な都市交通をミクロに再現する交通シミュレーター”, 2008年6月10日 •新聞報道 • 「交通状況 ミクロに予測」日刊工業新聞, 2008年6月11日(水)朝刊 •「車数百万台個別に再現」,日経産業新聞, 2008年6月11日(水)朝刊 •「交通シミュレート技術日本IBMと京大,共同開発」,フジサンケイビジネスアイ, 2008年6月11日(水)朝刊 •「都市交通シミュレータ開発CO2排出量予測も」化学工業日報,2008年6月12日(水)朝刊 •「IBMと京都大学,新方式の交通シミュレーション・システムを共同開発」,ITPro,2008年6月10日 •「高齢社会の交通問題も予測可能に:京大とIBMが共同研究」,未来の都市交通をシミュレーション,ITmedia,2008年6月10日 •「日本IBMと京都大学が共同で交通シミュレーションを開発」,マイコミジャーナル,2008年6月10日 •「京大と日本IBM,大規模交通社会シミュレーションシステムを開発」,PC Watch,2008年6月11日 •雑誌 •CO2激減!「人とクルマ」の新たな関係,プレジデント 2009年1.12号 •IBM 広告 •Op-ad #3: SMART TRAFFIC, Nov. 2008 (in the States) •「スマート」な交通システム,日経新聞2009年3月2日 •テレビCM •in the end June, 2009 (in Japan) https://www.youtube.com/watch?v=LlAbKHiaaac 会津IT秋フォーラム2017 3 TV CM出演を逃す;_;
  • 4. ©2017 Toyota InfoTechnology Center Co., Ltd. 2045年に人工知能は人間の能力を超えるか? 会津IT秋フォーラム2017 4
  • 5. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 5 出典:AAAI2017@Hilton San Francisco Union Squareにて加藤撮影
  • 6. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 6出典:AAAI2017@Hilton San Francisco Union Squareにて加藤撮影。写真右は加藤の左脚
  • 7. ©2017 Toyota InfoTechnology Center Co., Ltd. シンギュラリティ 技術的特異点 会津IT秋フォーラム2017 7
  • 8. ©2017 Toyota InfoTechnology Center Co., Ltd. シンギュラリティ 技術的特異点 会津IT秋フォーラム2017 8 1. 人間が計算機に支配される 2. 肉体を失い、計算機の中で生きる 3. 肉体は存続、知能強化/義体化 4. 何も起こらない
  • 9. ©2017 Toyota InfoTechnology Center Co., Ltd. クルマを取り巻くメガトレンド 2030年には京コンピュータレベルの計算機性能を持つ車載MMが搭載、クルマが感情を持って、 運転者と対話できるようになる? 会津IT秋フォーラム2017 2010 2020 2030 2040 シンギュラリティ 計算機 エージェント /人工知能 医療 クルマ ニューロモフィック 不揮発性ストレージメモリ 10 TBメモリ(1000ドル) マインドアップローディング 医療用ナノマシン 記憶用脳ナノボット 全脳シミュレーション 出典:The Singularity Is Near: When Humans Transcend Biology などを元にITC作成. 計算機性能は各種資料よりITC算出 ポストブレイン 仮想現実で人生の 半分を過ごす 9 脳-クルマインターフェース 感情を持つクルマ 1.2Z FLOPS (スパコン) 0.6Y FLOPS (スパコン) 10P FLOPS (スパコン) 45P FLOPS (パーソナル) 1E FLOPS (パーソナル) 2.3E FLOPS (スパコン) 京が車載MMに ポスト京が 車載MMに 1. 人間が計算機に支配される 2. 肉体を失い、計算機の中で生きる 3. 肉体は存続、知能強化/義体化 4. 何も起こらない 1. クルマ開発サイクル半減 2. 肉体を失い、移動不要
  • 10. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 10 ポスト・ヒューマン? https://www.youtube.com/watch?v=3Fm0Zirt8wI https://inhabitat.com/cyberdyne-unveils-mind-controlled-robot-exoskeleton-that-protects-fukushima-workers-from-nuclear-radiation/ https://matome.naver.jp/odai/2140193243282307701
  • 11. ©2017 Toyota InfoTechnology Center Co., Ltd. 現在の人工知能とその限界 会津IT秋フォーラム2017 11 人間の能力を超えた機能 機械では未だできないこと Alex Krizhevsky et al., "ImageNet Classification with Deep Convolutional Neural Networks," NIPS 2012 Courtesy of DeepMind. Courtesy of International Business Machines Corporation. http://www.drropra.com/understanding-practice-dynamic/ https://www.linkedin.com/pulse/20140820165325-19360894-secret-to-success-ask-the-right-question/ Inspiration Asking Right Question 忖度 空気を読む
  • 12. ©2017 Toyota InfoTechnology Center Co., Ltd. 本日のゴール 会津IT秋フォーラム2017 12 AIの仕組みをもう1段深く理解して、深いレベルまで俯瞰しよう → ケース: 自動運転車、深層学習、自然言語処理 その限界や意義を見極め、AI導入の投資対効果を涼しい頭で考えよう (ルールベースの方が現実問題上手くいっている場合もあります) (大規模な学習データ獲得のコストやオペレーションコストもかかります) 経営的視点から現実を理解しよう
  • 13. ©2017 Toyota InfoTechnology Center Co., Ltd. ケース1 完全自動運転は実現するか? 会津IT秋フォーラム2017 13
  • 14. ©2017 Toyota InfoTechnology Center Co., Ltd. 本日のゴール 14 Stanford Junior、Google Car、Autoware†など自律型自動運転システムに関する 公開情報を基に自律型自動運転システムを構成する要素技術の概要を具体的に理解する †http://www.pdsl.jp/fot/autoware/ 本発表は私個人の見解であり、所属する組織やグループ企業の立場、戦略、意見を代表するものではありません 会津IT秋フォーラム2017
  • 15. ©2017 Toyota InfoTechnology Center Co., Ltd. 問題:これらのイノベーションの共通点は? 15 https://en.wikipedia.org/wiki/Internet,https://en.wikipedia.org/wiki/Global_Positioning_System, https://en.wikipedia.org/wiki/Autonomous_car, https://ja.wikipedia.org/wiki/IPhone_4S GPS インターネット Siri 自動運転車 会津IT秋フォーラム2017
  • 16. ©2017 Toyota InfoTechnology Center Co., Ltd. 16http://www.darpa.mil/ 会津IT秋フォーラム2017
  • 17. ©2017 Toyota InfoTechnology Center Co., Ltd. DARPA概要 DARPAはスプートニクショックを受けて58年に設立以来、多くのイノベーションへ貢献してきている 17 ソ連、スプートニク1号 打ち上げ成功 1957年 高等研究計画局 設立 1958年 ARPANET 1969年 1978年 GPS DARPA Grand Challenge 2004,2005年 2007年 DARPA Urban Challenge https://en.wikipedia.org/wiki/Sputnik_1, https://en.wikipedia.org/wiki/DARPA, https://en.wikipedia.org/wiki/ARPANET https://en.wikipedia.org/wiki/Global_Positioning_System, http://archive.darpa.mil/grandchallenge04/ http://archive.darpa.mil/grandchallenge/index.html, https://en.wikipedia.org/wiki/DARPA_Robotics_Challenge https://cgc.darpa.mil/ Robotics Challenge 2012-15年 2014-2015年 Cyber Grand Challenge 会津IT秋フォーラム2017
  • 18. ©2017 Toyota InfoTechnology Center Co., Ltd. 18https://www.ted.com/talks/sebastian_thrun_google_s_driverless_car?language=en 会津IT秋フォーラム2017
  • 19. ©2017 Toyota InfoTechnology Center Co., Ltd. 19 1. 基礎 1. 緒言 2. 再帰的状態推定 3. ガウシアンフィルタ 4. ノンパラメトリックフィルタ 5. ロボットの動作 6. ロボットの知覚 2. ローカライゼーション 1. ロボットの位置推定 2. 移動ロボットのいち推定 3. 地図生成 1. 占有格子地図の生成 2. 姿勢と地図の同時推定 3. GraphSLAMアルゴリズム 4. 疎拡張情報フィルタ 5. FastSLAMアルゴリズム 4. 計画と制御 1. マルコフ決定過程 2. 部分観測マルコフ決定過程 3. POMDPの近似手法 4. 探査 https://images-na.ssl-images-amazon.com/images/I/51oedehWUdL._SX440_BO1,204,203,200_.jpg 目次は、上田訳、確率ロボティックス,2007 会津IT秋フォーラム2017
  • 20. ©2017 Toyota InfoTechnology Center Co., Ltd. 20 DGC 2005, スタンフォード大学 Stanley優勝 DGC 2007 スタンフォード大学 Junior準優勝 https://en.wikipedia.org/wiki/Stanley_(vehicle), http://archive.darpa.mil/grandchallenge/gallery.html https://www.youtube.com/watch?v=bDOnn0-4Nq8, https://www.udacity.com/ S. Thrun et al., Stanley, the robot that won the DARPA Grand Challenge, Journal of Field Robotics, 2006 M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008 2011,オンライン教育機関Udacity設立 2009 Google Self-Driving Cars 会津IT秋フォーラム2017
  • 21. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 21出典:AAAI2017@Hilton San Francisco Union Squareにて加藤撮影
  • 22. ©2017 Toyota InfoTechnology Center Co., Ltd. DARPA Urban Challenge 2007 DARPAはオフロードにおける軍事作戦を想定した2004年2005年のGrand Challengeに続き、 市街戦を想定したUrban Challengeを2007年に実施 22 Why develop autonomous vehicles? The National Defense Authorization Act for Fiscal Year 2001, Public Law 106-398, Congress mandated in Section 220 that “It shall be a goal of the Armed Forces to achieve the fielding of unmanned, remotely controlled technology such that… by 2015, one-third of the operational ground combat vehicles are unmanned.” DARPA conducts the Urban Challenge program in support of this Congressional mandate. Every “dull, dirty, or dangerous” task that can be carried out using a machine instead of a human protects our warfighters and allows valuable human resources to be used more effectively. http://archive.darpa.mil/grandchallenge/docs/Urban_Challenge_Team_Welcome_Meeting.pdf 会津IT秋フォーラム2017
  • 23. ©2017 Toyota InfoTechnology Center Co., Ltd. DARPA Urban Challenge 2007コースレイアウト エリアA(交差点左折、交通への流入)、エリアB(ナビ、駐車)、エリアC(交差点通過、Uターン)の 3つのエリアからなる 23http://archive.darpa.mil/grandchallenge/docs/Urban_Challenge_Team_Welcome_Meeting.pdf 会津IT秋フォーラム2017
  • 24. ©2017 Toyota InfoTechnology Center Co., Ltd. DARPA Urban Challenge 2007レギュレーション 市街戦を想定しながらも、カルフォルニア州の交通規則に従わないとマイナス点をつけられるなど 市街地走行に必要な安全性も要求 24 http://archive.darpa.mil/grandchallenge/docs/Urban_Challenge_Team_Welcome_Meeting.pdf, 保坂ら、自動運転 システム構成と要素技術,2015 • 直前に与えられたミッションに従った走行計画生成 • カルフォルニア州の交通規則に従った走行 • 複数の自動車とプロドライバが運転する30台の手動運転者が混在して走行する環境で安全に走行 • 州者スペースから他車両が走行する道路への合流 • ラウンドアバウトの通過 • 4方向一時停止交差点における到着順に応じた発信による交差点通過 • 交差点における信号・標識に応じtあ停止、発進 • 対向車料など他車両とのタイミングを調整した右左折 • 停止車両や障害物を避けての通過 • 対向2車線道路におけるUターン • 制限速度を認識して速度調整 • 軽目られた駐車場で駐車スペースを探索して駐車 以下の課題をクリアしながら約60マイル(97km)を6時間以内に走行。 各テスト車の後ろを追跡者が走行、危険な状態になった場合にはリ モコンで緊急停止。約100箇所のチェックポイントで、交通規則を守っ ているかを確認し、採点 会津IT秋フォーラム2017
  • 25. ©2017 Toyota InfoTechnology Center Co., Ltd. DARPA Urban Challenge 2007の結果 89台のチームが応募、準決勝を通過した11チーム中、6チームがチェッカーフラグを受ける。 優勝はTatan Racing、$2Mを獲得 25http://archive.darpa.mil/grandchallenge/gallery.html 1位: CMU 4:10:20 2位: Stanford 4:29:28 3位: Virginia Tech. 4:36:38 5位: U. Penn. > 6hours 6位: Cornell > 6 hours 4位: MIT Approx 6 hours 会津IT秋フォーラム2017
  • 26. ©2017 Toyota InfoTechnology Center Co., Ltd. 26 Applanix INSVelodyne laserRiegl laser SICK LMS laser SICK LDLRS laserDMIIBEO laserBOSCH Radar LiDAR GNSS/慣性走行装置 ミリ波レーダー 走行距離計 6軸慣性センサは搭載せず M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008 会津IT秋フォーラム2017
  • 27. ©2017 Toyota InfoTechnology Center Co., Ltd. Juniorにおけるソフトウェアフローダイアグラム センサー、位置推定モジュール、物体検出モジュール、UKF姿勢推定モジュール、軌道生成器等からなる 27M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008 会津IT秋フォーラム2017
  • 28. ©2017 Toyota InfoTechnology Center Co., Ltd. DARPA Urban Challenge 2007の意義 Googleによる自律型自動運転システムへの研究開発に引続き、2013年以降自動車会社や 部品会社から自動運転システムの発表が相次ぐ 28 路車協調方式 http://www.path.berkeley.edu/publications/general-publications, https://www.youtube.com/watch?v=7Yd9Ij0INX0 自律走行型 会津IT秋フォーラム2017
  • 29. ©2017 Toyota InfoTechnology Center Co., Ltd. 自律走行型自動運転システムを構築する要素技術 自律走行型自動運転システムを構築する要素のうち、太文字について続く頁にて説明する 29 経路計画 軌道生成 SLAM 自己位置推定 物体検出 経路追従 車両制御 地図生成 必要な技術処理内容 高精度3次元地図の生成 認知 判断 操作 フェーズ LIDAR, GNSS, カメラを搭載した車両を走らせ、点群 データを収集。点群データから高精度3次元地図を 作成 スキャンデータと、前述の3次元地図データが重な るようスキャンマッチング、地図内の位置、向きを 算出(自己位置推定)。他の車両や信号等物体検 出 スタートからゴールまでの大まかな経路に従い、車 両の運動特性を考慮してすぐ近くまでの滑らかな 経路を生成(経路生成)。各経路のコストを計算し、 経路を選択 生成された経路を追従するための速度、角速度を 車両に伝達 会津IT秋フォーラム2017
  • 30. ©2017 Toyota InfoTechnology Center Co., Ltd. 地図生成 車両にGPS とレーザスキャナ,カメラを搭載し,移動しながら三次元環境を復元するモービルマッピング システムにより地図を生成 30 モバイルマッピングシステム[1] [1]石川ら、モービルマッピングシステムによる都市空間モデリング、計測自動制御学会産業論文集、2009 高精度3次元地図 ポイントクラウド地図 • 3次元座標(緯度経度標高) • RGB値 ADAS地図 • ポイントクラウド地図から地物を抽出 • 信号、路面標示等 会津IT秋フォーラム2017
  • 31. ©2017 Toyota InfoTechnology Center Co., Ltd. 3次元LIDAR パルス状に発行するレーザー照射に対応する散乱光を測定することにより距離や、反射強度を測定する 装置 31 可動部の有無 メカレス型 メカニカルスキャン型 走査方式 光フェーズドアレイレー ダー MEMSミラーによるスキャ ン モーター駆動ミラーによるスキャン ビームフォーミング MEMSミラー 水平回転ポリゴンミラーの各面でピッチ角を 変更 複数素子による多層 化 電磁駆動共振ミラー 主な企業 Quanergy Systems 日本信号、パイオニア等 豊田中央研究所等 Velodyne、Valeo、コニ カミノルタ 北陽電気 価格 数万円 数万~数十万円 数十万円 数十万-数百万円 数十万円 レーザーを対象物に照射し、散乱光を測定することにより、対象物までの距 離や反射強度を取得。下図はVelodyne HDL-64e(測定距離100-120m, 垂直 視野26.8°、測定ポイント数1333000ポイント/秒 HDL-64e Uer's manual, Nikkei Robotics, 2016, GPU Technology Conference, Solid State LiDAR for Ubiquitous 3D Sensing Quanergy Systems社が採用するフェーズドアレー方式では従来の機構的な可 動部が不要になるため、低コスト化と小型化が期待される。写真はQuanergy Systems社のS3。 受光部 送信部 LSI 60mm 会津IT秋フォーラム2017
  • 32. ©2017 Toyota InfoTechnology Center Co., Ltd. 自己位置推定 自己位置推定とSLAM手法は大きく3つに分類される 32 自己位置推定 位置追従 大域的位置推定 (誘拐ロボット問題) 内界 センサデータ 外界 センサデータ 地図 自己位置 地図生成 既知の姿勢に 基づく地図生成 地図 外界 センサデータ 自己位置 姿勢と地図の 同時推定 (SLAM) 内界 センサデータ 外界 センサデータ 自己位置 地図 + = スキャンマッチン グ ベイズフィルタ グラフベース SLAM 性質 オンライン オンライン オフライン 概要 環境計測の点群 を最小化計算で 位置合わせ 制御動作に依る 事前確率と環境 計測による尤度 を確率的に融合 各時刻のロボット 位置や地図のラ ンドマーク位置の 関係をグラフを制 約条件として最 適化 推定の出力 現在のロボット位 置を点推定 現在のロボット位 置と地図を確率 分布として推定 移動軌跡や地図 のランドマーク位 置を点推定 手法の例 ICP, NDT等 EKF, PF等 完全SLAM等 m2 x0 x1 x2 x3 m1 移動 観測 情報行列Ω に移動や観測のデータ をどんどん追加 Ωからロボットの軌 跡を最適化で求める Ω:情報行列 = Σ-1 グラフベースSLAM 次頁以降で説明 原、自己位置推定・地図生成(SLAM)の全体像, Nikkei Robotics、2016 会津IT秋フォーラム2017
  • 33. ©2017 Toyota InfoTechnology Center Co., Ltd. 自己位置推定 スキャンマッチング(1/2) モバイルマッピングシステムで作成したポイントクラウド地図と自社がLIDARで計測したスキャン結果 を合わせ込むことで位置合わせを行う 33 ポイントクラウド地図 ポイントクラウド地図 スキャン結果 スキャンマッチングして 推定された位置 T : 車両の同次変換作用素(回転R+並進Tr) 𝑇∗ = argmin 𝑇 𝑘=1 𝐾 ||𝑚 𝑘 − 𝑇 ∙ 𝑑 𝑘|| 会津IT秋フォーラム2017
  • 34. ©2017 Toyota InfoTechnology Center Co., Ltd. 自己位置推定 スキャンマッチング(2/2) スキャンマッチングには点対点で評価するICPと、点対分布で評価するNDPが一般的に用いられる 34 Iterative Closest Points(ICP)[1] Normal Distributions Transform(NDP)[2] • 最近傍点間の距離の2乗和を最小化 • 計算量はO(MN) • 地図空間を正規分布で近似、入力スキャン の対応要素をニュートン法で探索 • 計算量はO(N) [1]P.J. Besl and N.D. McKay. A method for registration of 3d shapes. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1992. [2]P. Biber and W. Straber: The normal distributions transform:a new approach to laser scanmatching, Proc. of the 2003 IEEE/RSJ International Conference on Intelligent Robots and Systems, 2003 𝐸 𝑇 = 𝑖=1 𝑀 𝑗=1 𝑁 𝑤𝑖𝑗 ||𝑚𝑖 − 𝑇 ∙ 𝑑𝑗 || 𝑤𝑖𝑗 = 1 (𝑖と𝑗が対応点) =0 (𝑖と𝑗が対応点でない) ポイントクラウド地図{𝑑𝑗} 𝐸 𝑇 = 𝑗 𝑖=1 𝑛 𝑝(𝑇 ∙ 𝑑𝑖) j=1 j=2 𝑝(𝒙) = 1 Σ exp(− (𝒙−𝒒) 𝑇Σ−1(𝒙−𝒒) 2 ) n はボクセルの数含まれるdiの数 会津IT秋フォーラム2017
  • 35. ©2017 Toyota InfoTechnology Center Co., Ltd. 自己位置推定 ベイズフィルタ 制御動作による予測位置を計測結果の情報を使って更新する 35 𝑓 𝑥 𝑦 = 1 𝑓(𝑦) × 𝑓 𝑦 𝑥 𝑓 𝑥 = 𝜂 𝑓 𝑦 𝑥 𝑓(𝑥) ベイズの定理 f (x)がデータY=y を観測する前のX の確率分布とすると f (x|y)は、データY の観測値y を得た後のデータXの確率 分布と解釈される データの観測を通じて事前のより不確かな信念が事 後のより確かな信念に変化 上田訳、確率ロボティックス, https://en.wikipedia.org/wiki/Thomas_Bayes 𝑝 𝑥 𝑡|𝑢1:𝑡, 𝑧1:𝑡 = 𝜂 𝑝 𝑧𝑡 𝑥 𝑡, 𝑢1:𝑡 𝑝(𝑥 𝑡 |𝑧1:𝑡−1, , 𝑢1:𝑡) = 𝜂 𝑝 𝑧𝑡 𝑥 𝑡, 𝑢1:𝑡 𝑝(𝑥 𝑡 |𝑥 𝑡−1, , 𝑢 𝑡)𝑝 𝑥 𝑡−1 𝑢1:𝑡−1 , 𝑧1:𝑡−1 𝑑𝑥 𝑡−1 信念分布を正規分布で表現→KF, EKF, ノンパラベイズ → PF ポイントクラウド地図:m ロボット位置:𝑥 𝑡−1 制御動作:𝑢 𝑡 推定位置:𝑇(𝑢 𝑡)𝑥 𝑡−1 真の位置:𝑥 𝑡 会津IT秋フォーラム2017
  • 36. ©2017 Toyota InfoTechnology Center Co., Ltd. 自動運転システムでの自動走行までの流れ 駐車計画等も含めた起点終点情報から大まかな経路計画を立て、それに沿って軌道を生成、障害物 回避等を折り込みながら最終的な次の時間ステップの目標速度、目標加速度を車両に伝達 36 Hybrid-state A* Search [1] 他 Pure Pursuit Path Tracking Algorithm[2] PIDコントロール 他 [1] D. Dolgov, Practical Search Techniques in Path Planning for Autonomous Driving [2] R. Craig Conlter, Implementation of the Pure Pursuit Path Tracking Algorithm, CMU-RI-TR-92-0 経路計画 速度、角速度を車両へ伝達 軌道生成 経路追従 State Lattice Planner 他 会津IT秋フォーラム2017
  • 37. ©2017 Toyota InfoTechnology Center Co., Ltd. 軌道生成 現在姿勢と目標姿勢を繋ぐ曲線を生成、各曲線の評価関数を設定、安全な軌道を選択 37M. Montemerlo et al., Junior: The Stanford Entry in the Urban Challenge, Journal of Field Robotics, 2008 横方向のオフセット を設けた目標姿勢 軌道の曲率を考慮し、 車両が走行可能な 軌道を生成 生成した各軌道について評価関数を算出、 安全な軌道を選択 会津IT秋フォーラム2017
  • 38. ©2017 Toyota InfoTechnology Center Co., Ltd. ピュアパス追跡アルゴリズム ピュアパス追跡アルゴリズムにより、目標経路を実現する、目標速度と目標角速度が求まる 38R. Craig Conlter, Implementation of the Pure Pursuit Path Tracking Algorithm, CMU-RI-TR-92-0 x y (x ,y) r l dx y 𝑥2 + 𝑦2 = 𝑙2 𝑥 + 𝑑 = 𝑟 𝑦2 + 𝑑2 = 𝑟2 𝜅 = 2𝑥 𝑙2 ⟹ x y l look ahead distance 会津IT秋フォーラム2017
  • 39. ©2017 Toyota InfoTechnology Center Co., Ltd. 車両制御 Loodahead Distanceを適切に設定することにより、乗り心地のいい滑らかな運転を実現。 最終的に求まる目標速度と目標角速度を車両の送信 39[1]R. Craig Conlter, Implementation of the Pure Pursuit Path 'hcking Algorithm, CMU-RI-TR-92-0 lookhaed distanceの値によって車両の曲がり易さが変わる[1] 𝜔 𝑡 = 𝑣𝑐 𝜅 𝜅 = 2𝑥 𝑙2 𝑣 𝑡 𝜔 𝑡 l が小さい l が大きい 会津IT秋フォーラム2017
  • 40. ©2017 Toyota InfoTechnology Center Co., Ltd. 自動運転レベルの確認 NIT SA NITSA における 呼称 NITSAにおける定義 SAE SAEにおける 呼称 SAEにおける定義 ハンドル操作 と加速/減速 の実行主体 走行環境の モニタリング 運転操作の バックアップ主体 システム能力 (運転モード) 0 自動化な し 常時、ドライバーが、運転の 制御(操舵、制動、加 速)を行う 0 手動 ドライバが、常時、全ての運転操作を行う ドライバ ドライバ ドライバ 1 特定機能 の自動化 操舵、制動又は加速の支 援を行うが操舵・制動・加 速の全てを支援しない 1 補助 運転支援システムが走行環境に応じたハンドル操作、あるい は、加減速のいずれかを行うとともに、システムが補助をしてい ない部分の運転操作をドライバが行う ドライバ+シ ステム ドライバ ドライバ いくつかの 運転モード 2 複合機能 の自動化 ドライバーは安全運行の責 任を持つが、操舵・制動・加 速全ての運転支援を行う 2 部分的な 自動化 運転支援システムが走行環境に応じたハンドル操作と加減速 を行うとともに、システムが補助をしていない部分の 運転操作をドライバが行う システム ドライバ ドライバ いくつかの 運転モード 3 半自動運 転 機能限界になった場合のみ、 運転者が自ら運転操作を 行う 3 条件付き 自動化 システムからの運転操作切り替え要請にドライバーは適切に 応じるという条件のもと、特定の運転モードにおいて自 動化された運転システムが車両の運転操作を行う。 システム システム ドライバ いくつかの 運転モード 4 完全自動 運転 運転操作、周辺監視を全 てシステムに委ねるシステム 4 高度な自動化 システムからの運転操作切り替え要請にドライバーが適切に応 じなかった場合でも、特定の運転モードにおいて自動化された 運転システムが車両の運転操作を行う。 システム システム システム いくつかの 運転モード 5 完全自動化 ドライバでも対応可能ないかなる道路や走行環境条件のもと でも、自動化された運転システムが、常時、車両の運転操作 を行う システム システム システム 全ての 運転モード 出所:第5回オートパイロットシステムに関する検討会、http://www.mlit.go.jp/road/ir/ir-council/autopilot/pdf/05/2.pdf を元にIT開発センター作成 40会津IT秋フォーラム2017
  • 41. ©2017 Toyota InfoTechnology Center Co., Ltd. (参考情報) SheridenとInagakiは、人と機械の協調形態を表現する概念を11の自動化レベルで定義することを提案 レベル Sheriden, Inagakiの自動化レベルの定義 1 コンピュ-タの支援なしに,すべてを人間が決定・実行 2 コンピュ-タはすべての選択肢を提示し,人間はそのうちのひとつを選択して実行 3 コンピュ-タは可能な選択肢をすべて人間に提示するとともに,その中のひとつを選んで提案.それを実行するか否かは人間が決定 4 コンピュ-タは可能な選択肢の中からひとつを選び,それを人間に提案.それを実行するか否かは人間が決定 5 コンピュ-タはひとつの案を人間に提示.人間が了承すれば,コンピュ-タが実行 6 コンピュ-タはひとつの案を人間に提示.人間が一定時間以内に実行中止を指令しない限り,コンピュ-タはその案を実行 6.5 コンピュ-タはひとつの案を人間に提示すると同時に、その案を実行 7 コンピュ-タがすべてを行い,何を実行したか人間に報告 8 コンピュ-タがすべてを決定・実行.人間に問われれば,何を実行したか人間に報告 9 コンピュ-タがすべてを決定・実行.何を実行したか人間に報告するのは,必要性をコンピュ-タが認めたときのみ 10 コンピュ-タがすべてを決定し,実行 出所: T.B.Sheridan, Telerobotics, Automation, and Human Supervisory Control. MIT Press, 1992. T.Inagaki, et al, “Trust, self-confidence and authority in human-machine systems,” Proc. IFAC HMS, 1998. 41会津IT秋フォーラム2017
  • 42. ©2017 Toyota InfoTechnology Center Co., Ltd. 10年後には、世界の自動車の出荷台数の2割がLV2の自動運転車と予測されている 9147000 12091000 49848000 34420000 2350000023000 3600000 19800000 31550000 138000 3610000 9798000 706000 0 10000000 20000000 30000000 40000000 50000000 60000000 70000000 2014 2015 2020 2025 2030 LV1 LV2 LV3 LV4 自動運転車のレベル別世界市場規模予測(搭載車両出荷台数ベース)、単位台 予測 出所: 日刊自動車新聞、2015年7月22日 42会津IT秋フォーラム2017
  • 43. ©2017 Toyota InfoTechnology Center Co., Ltd. (参考情報) 戦略的イノベーション創造プログラム(SIP)では、一般道/自動車専用道でのLV2の開発実証を2018年、自動車 専用道でのLV3を2020年、LV4を2030年としている 戦略的イノベーション創造プログラム(SIP)における自動走行システムロードマップ 出所:内閣府、SIP(戦略的イノベーション創造プログラム)自動走行システム研究開発計画 2015年5月21日 43会津IT秋フォーラム2017
  • 44. ©2017 Toyota InfoTechnology Center Co., Ltd. (参考情報) 自動運転車実現のパスには、発展/革命/変革の3つのパスがあると考えられる 44出所:Sven Beiker, "Different Paths toward automated driving", Jan. 15, 2015 より転載 会津IT秋フォーラム2017
  • 45. ©2017 Toyota InfoTechnology Center Co., Ltd. まとめ •DARPA Grand Challenge/DARPA Urban Challengeを通じて、ロボティックス技術が自動運転 システムへ。自動車会社より2013年頃から乗用車の自動運転システムの発表相次ぐ •自動運転システムの基本的な構成は •センサー:LIDAR、ミリ波レダー、GNSS、DMI、IMU、カメラ •制御システム:認知モジュール、判断モジュール、操作モジュール •大量データ処理、運転時例外処理の学習、高精度地図等情報処理技術の担う役割が一層増しつつ ある •特に大量の自動運転システム搭載車が走り回る際のサイバー空間としての地図整備への期待が高い 45会津IT秋フォーラム2017
  • 46. ©2017 Toyota InfoTechnology Center Co., Ltd. ケース2 深層学習ブームの次にくるのは? 会津IT秋フォーラム2017 46
  • 47. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 47Courtesy of DeepMind.
  • 48. ©2017 Toyota InfoTechnology Center Co., Ltd. D. Silver et al. Mastering the game of Go without human knowledge. Nature. Vol 550, October 19, 2017, p. 354. doi: 10.1038/nature24270. 会津IT秋フォーラム2017 48 https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html https://deepmind.com/blog/alphago-zero-learning-scratch/
  • 49. ©2017 Toyota InfoTechnology Center Co., Ltd. DeepMindは2017年10月18日、自己対局のみでスキルアップする新囲碁AI "Alpha Go Zero"を発表。40日間で柯潔を破ったAlpha Go Masterに完勝 会津IT秋フォーラム2017 49 https://deepmind.com/blog/alphago-zero-learning-scratch/ https://www.nature.com/nature/journal/v550/n7676/full/nature24270.html
  • 50. ©2017 Toyota InfoTechnology Center Co., Ltd. 人工知能とは 人工知能とは、人工的にコンピュータ上などで人間と同様の知能を実現させよう という試み。最近注目を浴びているディープラーニングは機械学習の要素技術の1つ 50 人工知能 人工的にコンピュータ上などで人間と同様の知能を実現させようという試み 機械学習 人間が行っている学習の能力と同様の機能を計算機で実現しようとする試み ニューラルネット 脳機能に見られる特性を計算機上で表現した数学モデル ディープラーニング(深層学習) 多層構造のニューラルネットワーク Wikipedia記事を元にIT開発センター作成 会津IT秋フォーラム2017
  • 51. ©2017 Toyota InfoTechnology Center Co., Ltd. 機械学習とは 機械学習とは人間が行っている学習の能力と同様の機能を計算機で実現しようとする試み 51 入力 出力 制限速70km/h 歩行者有り 左折以外外進行禁止 直進以外外進行禁止 訓 練 時 ... 運 用 時 制限速60km/h 入力 出力 学習データセット 標識画像はGerman Traffic Sign Detection Benchmark (GTSDB)より 計算機 計算機 会津IT秋フォーラム2017
  • 52. ©2017 Toyota InfoTechnology Center Co., Ltd. 機械学習の技術動向 機械学習業界では、深層学習研究の割合が増えつつ有る 52各年のNIPS採択論文タイトルより用語を含む件数を数え上げ、その年の採択論文数で除算して比率をITC算出, https://papers.nips.cc/ 0% 10% 20% 30% 40% 50% 1987 1995 2000 2005 2010 2015 Neural SVM, kernel Deep Convex Submod ニューラルネット全盛の時代 機械学習全盛の時代 深層学習が盛り上がる 会津IT秋フォーラム2017
  • 53. ©2017 Toyota InfoTechnology Center Co., Ltd. ニューラルネットワークの基本計算 1層目のi 番目の入力 u1i に重み 𝑤1𝑗𝑖 をかけて足し合わせた後に、活性化関数f をかけて出力する 53 ...... 入 力 デ ー タ 出 力 デ ー タ l=1 l=2 l=Ll=3 u1 (1) 𝑢𝑗 (2) = 𝑖=1 𝐼 𝑤𝑗𝑖 (2) 𝑧𝑖 (1) + 𝑏𝑗 𝑧𝑗 (2) = 𝑓(𝑢𝑗 (2) ) 𝑓(𝑢) = max(𝑢, 0) 𝒖(𝑙+1) = 𝑾(𝑙+1) 𝒛(𝑙) + 𝒃(𝑙+1) 𝒛(𝑙+1) = 𝑓(𝒖(𝑙+1) ) 回帰の場合 訓練データセット 𝑥1, 𝑑1 , 𝑥2, 𝑑2 , … , 𝑥 𝑁, 𝑑 𝑁 𝐸 𝒘 = 1 2 𝑛=1 𝑁 | 𝐝 − 𝐲 𝒙 𝒏; 𝒘 | 𝟐 誤差関数 最適なパラーメタ 𝒘∗ = argmin 𝒘 𝐸(𝒘) 誤差関数が小さくなるように重みw を調整 →誤差逆伝播法 式(1) uI (1) uJ (2) u1 (2) 表記は、岡谷、深層学習、2015による 会津IT秋フォーラム2017
  • 54. ©2017 Toyota InfoTechnology Center Co., Ltd. 誤差逆伝播法 誤差を最小化するための各層の重みはのずらし方は、出力層から入力層に向かって逆方向に算出するこ とができる 54 第l-1層のユニットiと第l層のユニットjを繋ぐ結合の重みwji (l)に関する微 分は、微分の連鎖規則より となる。ここで右辺第2項は、前頁の式(1)より、簡単に 𝜕𝑢𝑗 (𝑙) 𝜕𝑤𝑗𝑖 (𝑙) = 𝑧𝑖 (𝑙−1) と求まる。但し此処で、式(1)の定数項については、重みがbj (l)のユニッ トが追加されていると見做している。 右辺第1項について、uj (l) の変動がE に与える影響は、第l+1層の各 ユニットkの入力uk (l+1) を変化こと以外では発生しないことが判る。即 ち、 𝜕𝐸 𝜕𝑢 𝑗 (𝑙) = 𝑘 𝜕𝐸 𝜕𝑢 𝑘 (𝑙+1) 𝜕𝑢 𝑘 (𝑙+1) 𝜕𝑢 𝑗 (𝑙) . 式(3) 𝜕𝐸 𝜕𝑤𝑗𝑖 (𝑙) = 𝜕𝐸 𝜕𝑢𝑗 (𝑙) 𝜕𝑢𝑗 (𝑙) 𝜕𝑤𝑗𝑖 (𝑙) 式(2) と表すと、式(2)は最終的に、 𝜕𝐸 𝜕𝑤𝑗𝑖 (𝑙) = 𝛿𝑗 (𝑙) 𝑧𝑖 (𝑙−1) 𝛿𝑗 (𝑙) = 𝑘 𝛿 𝑘 (𝑙+1) wkj (l+1) f ′ (uj (l) ) 式(3)の右辺第2項は、簡単にwkj (l+1) f ' (uj (l) ) となるから、 𝛿𝑗 (𝑙) ≝ 𝜕𝐸 𝜕𝑢𝑗 (𝑙) l-1 l l+1 u1 (1) uI (1) 𝛿𝑗 (𝑙) 𝛿1 (𝑙+1) 𝛿 𝑘 (𝑙+1) 𝛿 𝑘+1 (𝑙+1) ⋮ j i k 𝑧𝑖 (𝑙−1) 𝑘 図:誤差逆伝播の様子。𝛿𝑗 (𝑙) は層l+1の𝛿𝑗 (𝑙+1) が与えられれば計算可能 表記は、岡谷、深層学習、2015による 会津IT秋フォーラム2017
  • 55. ©2017 Toyota InfoTechnology Center Co., Ltd. 深層学習の概要 2000年後半以降、多層ニューラルネットの学習が可能になり、また各種ベンチマークで深層学習 の有効性が認知されるようになる 55 「浅い」ニューラルネット 「深い」ニューラルネット ...... 「浅い」ニューラルネット 「深い」ニューラルネット (多層ニューラルネット) 入 力 デ ー タ 出 力 デ ー タ 入 力 デ ー タ 出 力 デ ー タ • 2000年前半までは、多層ニューラルネットの学習が困難であった(勾配消失問題) • 各層毎に事前に学習し初期パラメータを与えることで多層ニューラルネットの学習ができることが確認(事前学習) • GPUやマルチコアCPUといった計算機能力が飛躍的に向上し、またウェブ上の充分な量のデータセットが集約 • 音声認識や画像認識のベンチマークテストで過去の記録が次々に塗り替えられことで有効性が認知 会津IT秋フォーラム2017
  • 56. ©2017 Toyota InfoTechnology Center Co., Ltd. 深層学習の概要 深層学習は、音声認識、画像解析、物体認識など幅広い分野で活用されつつある技術領域 56 適用エリア 適用アプリケーション モバイル 音声対話 音声認識 Web レコメンデーションエンジン ビデオ検索 自然言語処理 画像解析 自動翻訳 自動車 一般物体認識 高精度地図生成 画像解析 ロボット、ゲーム 強化学習 金融 フィンテック 深層学習の適用エリア 会津IT秋フォーラム2017
  • 57. ©2017 Toyota InfoTechnology Center Co., Ltd. 深層学習適用事例(1/3) 一般物体認識タスクでは、人間の精度よりも高い認識精度を達成した 57 容易 困難 物体カテゴリ識別 (Categorization) 物体検出 (Detection) 物体領域抽出 (Semantic segmentation) 一般物体認識の主要なタスク LSVRC(1000クラス物体識別タスク)のエラー率の推移 28 26 16 12 6.6 5.98 5.1 4.94 4.82 0 5 10 15 20 25 30 8層のCNNにより2位以下に 10%以上の差をつけてトロント 大学Hintonのチームが大勝 2012年のブレークスルー以降2 年で人間の精度を越す エラー率(%) 人間の認識精度 中山、"深層畳み込みニューラルネットワークによる画像特徴抽出と転移学習"を基にITC作成 会津IT秋フォーラム2017
  • 58. ©2017 Toyota InfoTechnology Center Co., Ltd. 深層学習適用事例(2/3) ロボットの分野では、深層学習により、ロボットが自動的に学習していけるようになりつつある 58 Deep Q Network • ニューラルネットでQ関数を近似するアプローチQ-Networkgaが提案されていたが、多層なネットワークで上手く学習/収束が行えな い、計算が遅い、実現しうる操作のシークエンスはほぼ無限通りあり、その中でバラバラなサンプリング試行を繰り返すと、学習結果の パラメータが振動したり発散したりする、などの問題があり、実際に性能が示される実装は行われていなかった。 • DQNでは、学習データセットをミニバッチ更新することでこの学習の不安定性を解消 BRETT (Berkely Robot for the elimination of tedious tasks) PFN CES2016ぶつからないクルマ V. Mnih, "Playing Atari with Deep Reinforcement Learning", https://youtu.be/JeVppkoloXs、PFN画像はCES2016にて加藤が撮影 会津IT秋フォーラム2017
  • 59. ©2017 Toyota InfoTechnology Center Co., Ltd. 深層学習適用事例(3/3) 画像解析の分野では、画像からその概念を機械が理解できるようになりつつある 59 図の内容を正しくキャ プション生成 図と全く関係のない キャプションを生成 会津IT秋フォーラム2017
  • 60. ©2017 Toyota InfoTechnology Center Co., Ltd. 人工知能関連企業のグローバルの動き 北米ではグーグル、マイクロソフト、ヤフー、百度等のIT企業が人工知能系人材獲得に注力している 60 上段画像はNIPS2015にて加藤が撮影、解像度を下げて掲載 下段画像はhttps://twitter.com/hashtag/nips2015 会津IT秋フォーラム2017
  • 61. ©2017 Toyota InfoTechnology Center Co., Ltd. プレイヤー相関図 基礎研究に従事するトロント大学モントリオール大学は多くの企業と連携、自動車分野でもAmazon やCVGLとの連携あり 61 MIT CSAIL CBBM 機関内のAI関連組織 (部署、学科、ラボ等) NYU  NYU Center for Data Science  Center for neural science  ECE Department 過去に所属等兼務出資 提携・共同研究人名 University of Toront IBM 大学・公的研究機関 大手企業 新興企業 Stanford SAIL Andrew Ng VICARIOUS Baidu DNN research Geoffrey Hinton DeepMind Technology Demis Hassavis FAIR Yann LeCun University Of Montreal MILA Yoshua Bengio Atomwise 医薬品 Amazon CVGL NASA BOSCH Carnegie Mellon University DARPA 提携? 自動車企業 NVIDIA UC Barkley 人工知能プラットフォーム開発 Yahoo 会津IT秋フォーラム2017
  • 62. ©2017 Toyota InfoTechnology Center Co., Ltd. 最新技術動向(1/3) 物体検出から、画像キャプション生成/QA、画像概念へ 62 画像キャプション生成 画像概念へ画像QA O. Vinyals et al., Show and Tell: A Neural Image Caption Generator, arXiv:1411.4555 K. Xu et al., Show, Attend and Tell: Neural Image Caption Generation with Visual Attention, arXiv:1502.03044 J. Andreas et al., Deep Compositional Question Answering with Neural Module Networks, arXiv:1511.02799 S. Antol et al., VQA: Visual Question Answering, arXiv:1505.00468 https://github.com/Newmu/dcgan_code F. Sadeghi et al., VISALOGY: Answering Visual Analogy Questions, arXiv:1509.08075 会津IT秋フォーラム2017
  • 63. ©2017 Toyota InfoTechnology Center Co., Ltd. 最新技術動向(2/3) 知識記憶機構の構築 63 Memory Networks (MemNN/MemN2N) Neural GPU へNeural Turing Machine (NTM) 学習によりアルゴリズムを獲得文章を記憶、質問に回答 並列化 加算 乗算 1010+0111 0110*0101 S. Sukhbaatar et al., End-To-End Memory Networks, arXiv:1503.08895 A. Graves et al., Neural Turing Machines, arXiv:1410.5401 Łukasz Kaiser and Ilya Sutskever, Neural GPUs Learn Algorithms, arXiv:1511.08228 会津IT秋フォーラム2017
  • 64. ©2017 Toyota InfoTechnology Center Co., Ltd. 最新技術動向(3/3) 特徴的なタスクへの適用 64 画像自動生成 (入力画像をNNが鳥と認識するように誘導) 視線検知 画像自動生成 (コンテントとスタイルの相関最大化) 視覚バイアス L.A. Gatys et al., A Neural Algorithm of Artistic Style, A Neural Algorithm of Artistic Style, arXiv:1508.06576 http://googleresearch.blogspot.jp/2015/06/inceptionism-going-deeper-into-neural.html J. Wu et al., Galileo: Perceiving Physical Object Properties by Integrating a Physics Engine with Deep Learning, NIPS2015 C. Vondrick et al., Learning visual biases from human imagination, NIPS2015 A. Recasens et al., Where are they looking?, NIPS2015, https://arxiv.org/abs/1609.03499 モノの物理的特徴の推論 音声合成 会津IT秋フォーラム2017
  • 65. ©2017 Toyota InfoTechnology Center Co., Ltd. GPUの基本的な構造 GPUの数千個のコアを活用し並列処理を行うことで、行列計算など演算密度の高い数値計算、機械学 習等画像処理以外に汎用的に利用(GPGPU)。開発フレームワークの例としてNVIDIA CUDAを説明 65 ホスト デバイ ス CPU メインメモリ L2 NVLink ← PCI-E ストリーミング マルチプロセッ サ CUDAコア (2000-4000個程度) 共有メモリ レジスタ CUDAにおける言語拡張GPUの基本的な構造 • 関数修飾子 ホストとデバイスのどちらで実行するかを指定 • __global__, __device__, __host__ • カーネル関数呼び出し • kernel <<<grid,block>>>(); • grid: ブロックによるグリッドの次元とサイズ • block: スレッドによるブロックの次元とサイズ • dim3宣言 3次元ベクトルの整数型の宣言 • ホスト同期 • cudaMemcpy() • cudaThreadSynchronize() grid block thread #include <stdio.h> __global__ void helloFromGPU(){ printf("GPU¥n"); } int main(int argc,char **argv){ printf("CPU¥n"); dim3 block(10,1); dim3 grid(1,1); helloFromGPU<<<grid,block>>>(); cudaDeviceReset(); } CUDAによるプログラミング例 会津IT秋フォーラム2017
  • 66. ©2017 Toyota InfoTechnology Center Co., Ltd. ケース3 機械は人間の話を理解できるか? 会津IT秋フォーラム2017 66
  • 67. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 67 Courtesy of International Business Machines Corporation. https://www.youtube.com/watch?v=P18EdAKuC1U
  • 68. ©2017 Toyota InfoTechnology Center Co., Ltd. 機械が自然言語を理解するには? John R. Firth(1890-1960) "You shall know a word by the company it keeps" (Firth) 似た文脈で出現する単語同士は 意味も似ている(分布仮説) 古典的手法 • 分布的意味表現(Distributional Semantic Representations) • 文脈中に現れる単語の共起頻度で表現 • 高次元、疎 → 計算コストがかかる 現代的手法 • 分散的意味表現(Distributed Semantic Representations) • 数千次元のベクトル空間中のベクトルとして表現する • 低次元、密、word2vecが公開、安定、高速 • 深層学習ブームやチャットボットブームに相まって実用 特殊なケースでは両者は実は等価であることが 理論的、実験的に証明 P2-P7で説明 P8-P13で説明 会津IT秋フォーラム2017 68
  • 69. ©2017 Toyota InfoTechnology Center Co., Ltd. 問題: ??? に入る単語は何か? S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA 会津IT秋フォーラム2017 69
  • 70. ©2017 Toyota InfoTechnology Center Co., Ltd. 問題: ??? に入る単語は何か? S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA 会津IT秋フォーラム2017 70
  • 71. ©2017 Toyota InfoTechnology Center Co., Ltd. 正解は "dog" 単語集合V 文脈語集合 C 共起頻度行列 S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA 会津IT秋フォーラム2017 71
  • 72. ©2017 Toyota InfoTechnology Center Co., Ltd. svdによる次元圧縮 |V| = |C | とすると、共起頻度行列のサイズは 1000000 x 1000000 但し、データサイズよりも、行列が疎である方が問題 → 次元圧縮により、有効な次元を抽出 𝑀 = 𝑈 Σ 𝑉† 但し、ここでMは共起頻度行列(ランクr)、Uはユニタリ行列、Σは特異値を対角成分に持つ行列、 V†は、ユニタリ行列の随伴行列 d個の特異値で打ち切った対角行列 𝑀でΣ を近似すると、 単語ベクトルを𝑈Σで近似すると、次元を|V|からdへ圧縮できる m x n m x m m x n n x n 𝑀 𝑀† ≃ 𝑈Σ (𝑈Σ)† . 会津IT秋フォーラム2017 72
  • 73. ©2017 Toyota InfoTechnology Center Co., Ltd. 幾何学的解釈 類似度計測にはユークリッド距離よりも、特徴量空間のベクトルの成す角度が重要 S. Evert, "Distributional Semantic Models," Tutorial at NAACL-HLT 2010, Los Angeles, CA 会津IT秋フォーラム2017 73
  • 74. ©2017 Toyota InfoTechnology Center Co., Ltd. [Mikolov et al., 2013] Mikolov et al. , "Distributed Representations ofWords and Phrases and their Compositionality, " NIPS 2013 Mikolov et al., "Linguistic Regularities in Continuous SpaceWord Representations," Proceedings of NAACL-HLT 2013, pages 746–751,. Atlanta, Georgia, 9–14 June 2013会津IT秋フォーラム2017 74
  • 75. ©2017 Toyota InfoTechnology Center Co., Ltd. スキップグラムモデル[1] [1] Mikolov et al. , "Distributed Representations ofWords and Phrases and their Compositionality, " NIPS 2013 • 周辺単語を予測するように、単語ベクトルを学習するモデル (対数双線形モデル) • 周辺単語から周辺単語を予測するモデル (連続バッグオブワーズ)も同時に提案) • 高性能な実装がオープンソースで公開、更に、ベクトルの 加法構成性から大反響 • 単語w に対して文脈c が発生する条件付き確率 P(c|w) の対数尤度を最大化する。但し、ここで、vw , vc, はそれぞれ、 単語wのベクトル、文脈cのベクトルを示す。 𝑃(𝑐|𝑤) = exp(𝒗 𝑤∙𝒗 𝑐) 𝑐′∈𝒱 exp( 𝒗 𝑤∙𝒗 𝒄′) 会津IT秋フォーラム2017 75
  • 76. ©2017 Toyota InfoTechnology Center Co., Ltd. 負例サンプリングによる近似[1] 負例サンプリングによる手法は、自己相互情報量を利用したSVDと同じであることが判明 [2] [1] Mikolov et al. , "Distributed Representations ofWords and Phrases and their Compositionality, " NIPS 2013 [2] O. Levy and Y. Goldberg, "Neural Word Embedding as Implicit Matrix Factorization," NIPS 2014 𝑃(𝑐|𝑤) = exp(𝒗 𝑤∙𝒗 𝑐) 𝑐′∈𝒱 exp( 𝒗 𝑤∙𝒗 𝒄′) 百万個のコーパスについて 計算するのが大変 2つのモデリング 1. P(c|w) を2値分類(ロジスティクス回帰)でモデル化 2. 1つの学習事例毎に、ランダムに生成したk個の負例とを識別できるように学習 𝑃(𝑐|𝑤) ≃ σ(𝒗 𝑤∙𝒗 𝑐) 𝑐′∈Unigram 𝑘(𝒟) 𝜎(−𝒗 𝑤∙𝒗 𝒄′) k個のサンプリング (20個程度) シグモイド関数 会津IT秋フォーラム2017 76
  • 77. ©2017 Toyota InfoTechnology Center Co., Ltd. word2vecによる実装とその使い方具体例 •実装がスレッドプログラミングによりチューニングされているので、CPUでも高速、安定的に動作 •公開後、エンジニアの間で大流行 会津IT秋フォーラム2017 77https://github.com/tmikolov/word2vec
  • 78. ©2017 Toyota InfoTechnology Center Co., Ltd. アプリケーション1: 言語間の翻訳 英語 スペイン語 Mikolov et al. , "Exploiting Similarities among Languages for Machine Translation, " arXiv:1309.4168 会津IT秋フォーラム2017 78
  • 79. ©2017 Toyota InfoTechnology Center Co., Ltd. アプリケーション2: 文章のベクトル表現 連続バッグオブワーズ Le et al., "Distributed Representations of Sentences and Documents," arXiv:1405.4053 パラグラフベクトル 周辺単語(文脈)に加えて、文書固有のベクトルも単語予測に利用。文書分類精度向上 会津IT秋フォーラム2017 79
  • 80. ©2017 Toyota InfoTechnology Center Co., Ltd. 深層学習による可読な機械間コミュニケーション言語の創発 会津IT秋フォーラム2017 80 これまでの深層学習 ぶつからないように強化学習できるが、そのルール が人間が理解できない 最新の研究(*) 機械が作成した画像についての説明文を機械が理解して 当てるというタスクにおいて、機械間で言語が創発 →機械間の効率的な言語を生成可能なことを示唆 *S. Havrylov et al., “Emergence of Language with Multi-agent Games: Learning to communicate with sequences of symbols,” ICLR 2017 workshop submission
  • 81. ©2017 Toyota InfoTechnology Center Co., Ltd. ポストAIを見据えた日本企業の経営戦略 会津IT秋フォーラム2017 81
  • 82. ©2017 Toyota InfoTechnology Center Co., Ltd. 「妄想しカタチにする力」("シン・ニホン" 安宅, 2017) 会津IT秋フォーラム2017 82 https://commons.wikimedia.org/wiki/File:Steve_Jobs_Headshot_2010-CROP.jpg https://commons.wikimedia.org/wiki/File:Dragon_V2_unveiling,_Elon_Musk_(KSC-2014-2727).jpg
  • 83. ©2017 Toyota InfoTechnology Center Co., Ltd. Hallis Labs, Kitt.ai, Kaggle等AIスタートアップのM&Aが続く 会津IT秋フォーラム2017 83https://www.cbinsights.com/research/top-acquirers-ai-startups-ma-timeline/
  • 84. ©2017 Toyota InfoTechnology Center Co., Ltd. 0 100 200 300 400 500 600 700 UnitedhealthGroup Inc Home DepotInc Comcast Corp Walt Disney Co Citigroup Inc General Electric Co Visa Inc Anheuser-Busch InbevSa Johnson & Johnson Bank Of America Corp Samsung Electronics Co Ltd Jpmorgan Chase & Co Wells Fargo & Co Tencent Holdings Ltd Berkshire Hathaway Inc Facebook Inc Microsoft Corp Amazon.Com Inc Alphabet Inc Apple Inc 133 137 140 146 152 153 159 178 192 193 198 214 218 258 277 330 346 392 470 660 時価総額ランキング そこに日本の姿はない 会津IT秋フォーラム2017 84 Change in market cap 2009-2017 ($bn) 出典: Bloomberg and PwC analysis を基に加藤作成 IT Company
  • 85. ©2017 Toyota InfoTechnology Center Co., Ltd.会津IT秋フォーラム2017 85NIPS2016@Centre Convencions Internacional Barcelona, Barcelona SPAIN にて加藤撮影 AI系国際会議 そこにも日本の姿はない
  • 86. ©2017 Toyota InfoTechnology Center Co., Ltd. (再掲)人工知能関連企業のグローバルの動き 初任給2,000万円の世界 86 上段画像はNIPS2015にて加藤が撮影、解像度を下げて掲載 下段画像はhttps://twitter.com/hashtag/nips2015 会津IT秋フォーラム2017
  • 87. ©2017 Toyota InfoTechnology Center Co., Ltd. 日本企業へのヒント1: Go Global 会津IT秋フォーラム2017 87TRIにて加藤撮影
  • 88. ©2017 Toyota InfoTechnology Center Co., Ltd. 日本企業へのヒント2: ユーザエクスペリエンス 会津IT秋フォーラム2017 88 Uber画面を加藤撮影 Amazon 本社@シアトルにて加藤撮影 テクノロジー駆動の新しい圧倒的な体験
  • 89. ©2017 Toyota InfoTechnology Center Co., Ltd. 日本企業へのヒント3: ヴィジョナリー 会津IT秋フォーラム2017 89 トップ主導の経営者ヴィジョン構築 ミドル主導の技術者(PM)ヴィジョン構築 https://upload.wikimedia.org/wikipedia/commons/a/a4/Larry_Page_%28cropped%29.jpg https://commons.wikimedia.org/wiki/File:Eric_Schmidt_at_the_37th_G8_Summit_in_Deauville_037_(crop).jpg https://commons.wikimedia.org/wiki/Category:Sergey_Brin#/media/File:Sergey_Brin_Ted_2010.jpg https://www.ncbi.nlm.nih.gov/books/NBK36337/ "DARPA's Approach to Innovation and Its Reflection in Industry " Lawrence H. Dubois,SRI International
  • 90. ©2017 Toyota InfoTechnology Center Co., Ltd. 本日のまとめ 会津IT秋フォーラム2017 90 AIの仕組みをもう1段深く理解して、深いレベルまで俯瞰しよう → ケース: 自動運転車、深層学習、自然言語処理 その限界や意義を見極め、AI導入の投資対効果を涼しい頭で考えよう (ルールベースの方が現実問題上手くいっている場合もあります) (大規模な学習データ獲得のコストやオペレーションコストもかかります) 経営的視点から現実を理解しよう
  • 91. ©2017 Toyota InfoTechnology Center Co., Ltd. 91 ありがとうございました 会津IT秋フォーラム2017