SlideShare a Scribd company logo
1 of 70
Download to read offline
エヌビディア
ディープラーニングソリューションアーキテクト 兼 CUDAエンジニア 村上 真奈
エヌビディアが加速するディープラーニング
~進化するニューラルネットワークとその開発方法について~
2
AGENDA
ディープラーニングの最新動向
なぜGPUがディープラーニングに向いているか
ディープラーニングSDK / NVIDIA DIGITS
ディープラーニング・フレームワーク / ディープラーニングの基礎
http://www.slideshare.net/NVIDIAJapan/ss-61344653
3
ディープラーニングの最新動向
4
拡がり続けるモダンAIの地平
1000以上のAIベンチャー
5000億円調達
5
様々な分野でディープラーニングを応用
インターネットとクラウド
画像分類
音声認識
言語翻訳
言語処理
感情分析
推薦
メディアとエンターテイメント
字幕
ビデオ検索
リアルタイム翻訳
機械の自動化
歩行者検出
白線のトラッキング
信号機の認識
セキュリティと防衛
顔検出
ビデオ監視
衛星画像
医学と生物学
癌細胞の検出
糖尿病のランク付け
創薬
6
人工知能にとって驚くべき一年
AlphaGo
世界チャンピオンを倒す
マイクロソフトとグーグルが
画像認識で人間を超える
マイクロソフト
スーパーディープネットワーク
バークレーのブレット
全てのロボットを
一つのネットワークで
Deep Speech 2
二つの言語を
一つのネットワークで
新コンピューティングモデル
がポップカルチャーにも
7
ILSVRC top-5 error on Image Net
人間よりも早く正確な認識
ILSVRC15
8
AlphaGo
モンテカルロ木探索とディープラーニングを組み合わせたシステム
3 週間、50GPUを用いて3億4千万回のトレーニング・ステップでDNNをト
レーニング
対局: 40の検索スレッド、1202個のCPUと176個のGPUを使用して計算
バリューネットワークで基盤の状況を予測し、ポリシーネットワークで手の評
価を行う
全5局の対局、囲碁のヨーロッパチャンピオンと世界チャンピオンに勝利
プロ棋士を破った世界初の囲碁のコンピュータープログラム
http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
http://deepmind.com/alpha-go.html
9NVIDIA CONFIDENTIAL. DO NOT DISTRIBUTE.
Baidu Deep Speech 2
英語と中国語(北京語)の音声認識
シンプルにエンドツーエンドのディープラーニングを用いて英語から中国語への変換を行う
人間より高い認識精度
エラー率(Deep Speech 2) 3.7%
エラー率(人間へのテスト) 4%
http://svail.github.io/mandarin/
http://arxiv.org/abs/1512.02595
英語と中国語のディープラーニングを用いたエンドツーエンド音声認識
10
自律走行車の為のディープラーニング
11
ディープラーニングを用いた画像合成
CNNを用いたテクスチャ合成と変換 NVIDIA Research、 Timo Aila 他
14
ディープラーニングの事例
画像ノイズ除去および高解像度化
Eigen , ICCV 2010
Dong et al, ECCV 2014
15
ディープラーニングの事例
曲調をベースとした音楽のリコメンデーション
http://benanne.github.io/2014/08/05/spotify-cnns.html
音楽のスペクトログラム
を入力
“タグ”出力
17
ディープラーニングの事例
ゲームプレイ
Google DeepMind
18
なぜGPUがディープラーニングに向いているか
19
ディープラーニングを加速する3つの要因
“The GPU is the workhorse of modern A.I.”
ビッグデータ GPUDNN
20
典型的なネットワーク例
多量なトレーニングデータと多数の行列演算
目的
顔認識
トレーニングデータ
1,000万~1億イメージ
ネットワークアーキテクチャ
10 層
10 億パラメータ
ラーニングアルゴリズム
30 エクサフロップスの計算量
GPU を利用して30日
21
木
猫
犬
機械学習ソフトウェア
“亀”
フォワード プロパゲーション
“亀” から “犬” へ
計算の重み付けを更新
バックワード プロパゲーション
学習済みモデル
“猫”
反復
トレーニング
推論
22
DLトレーニングシステム
Caffe Theano Torch
GPUs
Chainer
DLフレームワーク
DLアプリケーション
Tensor
Flow
CNTK
23
DLトレーニングシステム
Caffe Theano Torch
GPUs
Chainer
DLフレームワーク
DLアプリケーション
Tensor
Flow
CNTK
cuBLAS, cuDNN, cuSPARSE
24
データサイエンティスト R&D サイクル
Idea
Code
Train
Test
クリティカルパス:
Ideaが沸いてから
Testが完了するまで
サイクルを速く回すことが重要
25
データサイエンティスト R&D サイクル
Idea
Code
Train
Test
時間がかかる GPUの利用
26
ディープラーニングSDK
27
GPU による性能向上
CNN における学習時間
バッチサイズ 学習時間(CPU) 学習時間(GPU) GPU/CPU比
64画像 64s 7.5s 8.5X
128画像 124s 14.5s 8.5X
256画像 257s 28.5s 9.0X
デュアル 10 コア Ivy Bridge CPU
1 Tesla K40 GPU
CPU: Intel MKL BLAS ライブリを活用
GPU: CUDA行列ライブラリ(cuBLAS)を使用
ILSVRC12でSupervisionが使用したモデル
7層
5層の畳み込みと2層の全結合
ReLU、プーリング、ドロップアウト、正規化
Caffeを使用
20反復のトレーニング時間
28
GPU による性能向上(inference)
Xeon E5-2698 と Tesla M40
NVIDIA Whitepaper “GPU based deep learning inference: A performance and power analysis.”より
29
NVIDIA ディープラーニングSDK
GPUで高速化されたディープラーニングのアプリケー
ションを設計、開発する為の強力な開発ツールおよ
びライブラリ
NVIDIA GPUの為の高速なディープラーニング環
境を保障
最新のディープラーニング・アルゴリズムをGPUに
最適化した状態で提供
ディープラーニング・アプリケーションを簡単に構築
https://developer.nvidia.com/deep-learning-software
30
ディープラーニング
cuDNN
数学ライブラリ
cuBLAS cuSPARSE
マルチGPU
NCCL
cuFFT
NVIDIA ディープラーニング SDK
GPUで高速化されたディープラーニングの為の開発ツールおよびライブラリ
31
NVIDIA cuDNN
GPU上でディープニューラルネットワークの計算を
高速に行う為のプリミティブ群
ディープニューラルネットワークの学習の高いパ
フォーマンスを発揮
Caffe、 CNTK、 Tensorflow、 Theano、
Torch、Chainerなどディープラーニングフレー
ムワークを高速化
バージョンアップ毎にパフォーマンスが向上
“NVIDIAはcuDNNのリリースの度により多くの操作
ができるような機能拡張をおこなっており、同時
に計算速度も向上させている”
—UC バークレー、 Caffe リードデベロッパー、 Evan Shelhamer
developer.nvidia.com/cudnn
AlexNet training throughput based on 20 iterations,
CPU: 1x E5-2680v3 12 Core 2.5GHz.
0.0x
2.0x
4.0x
6.0x
8.0x
10.0x
12.0x
2014 2015 2016
K40
(cuDNN v1)
M40
(cuDNN v3)
Pascal
(cuDNN v5)
32
cuDNN 5 のアップデート
Torch上でLSTM リカレントニューラルネットワークの
計算を6倍高速化
パフォーマンスの向上:
• VGG、GoogleNet、ResNetsのような3x3 畳み込み
層を持つネットワークの高速化
• 3次元畳み込み
• Pascal世代のGPUの為のFP16ルーティンの追加
Pascal世代GPU, リカレントニューラルネットワーク, パフォーマンスの向上
Performance relative to torch-rnn
(https://github.com/jcjohnson/torch-rnn)
DeepSpeech2: http://arxiv.org/abs/1512.02595
Char-rnn: https://github.com/karpathy/char-rnn
5.9x
char-rnn
RNN レイヤーの速度向上
2.8x
DeepSpeech 2
RNNレイヤーの速度向上
33
cuDNN Algorithms
• 多種多様なアルゴリズムを提供。cuDNNが自動で最適なアル
ゴリズムを決定
• CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_GEMM
• CUDNN_CONVOLUTION_FWD_ALGO_IMPLICIT_PRECOMP_GEMM
• CUDNN_CONVOLUTION_FWD_ALGO_GEMM
• CUDNN_CONVOLUTION_FWD_ALGO_DIRECT
• CUDNN_CONVOLUTION_FWD_ALGO_FFT
• CUDNN_CONVOLUTION_FWD_ALGO_FFT_TILING
• CUDNN_CONVOLUTION_FWD_ALGO_WINOGRAD
34
DL学習を加速するCUDAライブラリ
cuBLAS
密行列演算ライブラリ
cuFFT
高速フーリエ変換用ライブラリ
cuSPARSE
疎行列演算ライブラリ
cuSPARSE
36
密行列演算ライブラリ: cuBLAS
FP16(半精度浮動小数点)ストレージ
FP32と比べて, 2倍のデータをGPUメモリに搭載可能, メモリバンド幅
要求が半分
cublasSgemmEx()
FP16データ入出力対応の行列積 (演算はFP32)
符号部
(1 bit)
指数部
(5 bit)
仮数部
(10 bit)
37
cuSPARSE: 疎行列演算ライブラリ
自然言語処理向け機能拡張
密行列 x 疎ベクトル
cusparse<T>gemvi()
y = α ∗ op(A) ∗ x + β ∗ y
-
2
-
-
1
y1
y2
y3
α + β
y1
y2
y3
A11
A21
A31
A12
A22
A32
A13
A23
A33
A14
A24
A34
A15
A25
A35
密行列密ベクトル 疎ベクトル
(例) テキスト内の単語の出現頻度
NVIDIA cuSPARSE
38
NCCL(NVIDIA Collective Collection Library)
マルチGPU集合通信ライブラリ
• 最新リリースはv1.2.1
• https://github.com/NVIDIA/nccl
all-gather, reduce, broadcast など標準的な集合通信の処理をバンド幅が出るように最適化
シングルプロセスおよびマルチプロセスで使用する事が可能
ディープラーニング SDK
39
NCCL(NVIDIA Collective Collection Library)
NCCLの集合通信処理
40
NCCL パフォーマンス
Bandwidth at different problem sizes (4 Maxwell GPUs)
All-Gather
All-Reduce
Reduce-Scatter
Broadcast
41
DIGITS
42
DIGITS
WebベースのディープラーニングGPUトレーニングシステム
ディープラーニング SDK
ユーザー
インターフェース
レイヤーの
可視化
学習モデルの
作成
データセット
の作成
学習過程の
可視化
DIGITS(UI/Server)
ディープラーニングの学習・テストを
簡単に行う為のUI
別マシンからDIGITSを操作する為の
サーバ機能
Chainer
GPUGPU HW クラウドGPUクラスタマルチGPU
Theano
Torch
Caffe
cuDNN, cuBLAS
CUDA
学習
NVCaffe
cuDNN, cuBLAS
CUDA
NVCaffe
BVLC/caffe(本家)からフォーク
最新のCUDAライブラリを使用
エヌビディアGPUに最適化
43
NVIDIA DIGITS
GPUで高速化されたディープラーニングトレーニング・システム
Test Image
学習過程の可視化モデルの作成学習データの作成 モデルのテスト
http://developer.nvidia.com/digits
44
DIGITS3
Torch7に対応(プレビュー)
cuDNN4を使った学習/推論
HDF5形式のデータセットのサポート
学習データセットのブラウジング機能
LMDB形式の学習データの中身を確認出来る機能が追加
ジョブマネージメント機能の強化
現在実行中のジョブ一覧を分かりやすく表示する機能が追加
学習結果比較用ブラウザ
学習済みモデルを正解率やロス率など幾つかの項目でソートしたり、分析できる画面が追加
強化されたワークフローで効率よく学習
45
DIGITS download
developer.nvidia.com/digits github.com/NVIDIA/DIGITS
46
ディープラーニング・フレームワーク
47
ディープラーニング・フレームワーク
Mocha.jl
ディープラーニング・フレームワーク
GPUで高速化されているディープラーニング・フレームワークが多数存在
https://developer.nvidia.com/deep-learning-frameworks
48
ディープラーニング・フレームワーク
Caffe Torch7 Theano TensorFlow Chainer
インターフェース C++/Python/Matlab Lua/C Python C/C++/Python Python
cuDNN 5 5 5 5 5
ライセンス BSD-2 BSD BSD Apache 2.0 MIT
マルチGPU
(1ノード) ○ ○ ○ ○
モデルの柔軟性 △ ◎ ◎ ○ ◎
CNN ○ ○ ○ ○ ○
RNN
○
#2033
○ ○ ○ ○
RBM × ○ ○ ○ ○
備考
高速
Caffe Model Zoo
多数のアルゴリズムを
サポート
自動微分
自動微分
TensorBoard
Define by Run
CuPy
49
ディープラーニングの基礎
50
NVIDIA ディープラーニング学習コース
ディープラーニングの為の自習型のクラス。ハンズオンラボ、講義資料、講義の録画を公開。
ハンズオンラボは日本語で受講可能
https://developer.nvidia.com/deep-learning-courses
1. ディープラーニング入門
2. 画像分類の為のDIGITS入門
3. Caffe入門
4. Theano入門
5. Torch入門
NVIDIA ディープラーニング・インスティチュート
51
qwikLABS:AWSを用いた自主学習ラボ
• https://nvidia.qwiklab.comに多数のラボを公開
• 「ディープラーニング入門」は無料。日本語で受講可能。無料のアカウントを作る必要あり。
手元のPCにGPUが搭載されていなくてもOK
52
qwikLABS:AWSを用いた自主学習ラボ
• 「ディープラーニング入門」は無料。日本語で受講可能。
手元のPCにGPUが搭載されていなくてもOK
https://developer.nvidia.com/deep-learning-courses https://nvidia.qwiklab.com
53
ディープラーニング入門
AGENDA
ディープラーニングとは?
Caffe
Theano
Torch7
DIGITS
54
ディープラーニングとは?
55
人工ニューロン
神経回路網をモデル化
スタンフォード大学cs231講義ノートより
神経回路網
w1 w2 w3
x1 x2 x3
y
y=F(w1x1+w2x2+w3x3)
F(x)=max(0,x)
人工ニューロン
56
人工ニューラルネットワーク
単純で訓練可能な数学ユニットの集合体
ニューラルネットワーク全体で複雑な機能を学習
入力層 出力層
隠れ層
十分なトレーニングデータを与えられた人工ニューラルネットワークは、入力データから判断を行う
複雑な近似を行う事が出来る。
57
ディープラーニングの恩恵
 ロバスト性
 特徴量の設計を行う必要がない。 – 特徴は自動的に獲得される学習用データのバラつきの影響を
押さえ込みながら、自動的に学習していく
 一般性
 同じニューラルネットワークのアプローチを多くの異なるアプリケーションやデータに適用する事が出来る
 スケーラブル
 より多くのデータで大規模並列化を行う事でパフォーマンスが向上する
58
従来型の機械学習を用いた認識
人間が設計した特徴量を使用
Speaker ID,
speech transcription, …
Rowデータ 特徴抽出 結果分類・検出
SVM,
shallow neural net,
…
HMM,
shallow neural net,
…
Clustering, HMM,
LDA, LSA
…
Topic classification,
machine translation,
sentiment analysis…
59
ディープラーニングのアプローチ
認識:
犬
猫
蜜穴熊
エラー
犬
猫
アライグマ
犬
トレーニング:
モデル
モデル
60
Caffe
61
Caffe
飛行機、自動車、鳥、猫、鹿、犬、蛙、馬、船、トラックの 10 個の分類
32 × 32 ピクセルの 6 万枚のカラー画像から成るデータセット
CIFAR10 を用いた学習
62
Caffe
layer {
name: "conv1"
type: "Convolution"
bottom: "data"
top: "conv1"
param {
lr_mult: 1
}
param {
lr_mult: 2
}
convolution_param {
num_output: 32
pad: 2
kernel_size: 5
stride: 1
}
}
ネットワーク定義ファイル(例)
使用するネットワークの定義を行う
レイヤーの数や、各レイヤーのタイプ
レイヤータイプ毎のパラメータなどを記述
63
Caffe
# トレーニングとテストに使用するネットワークの定義
net: "examples/cifar10/cifar10_quick_train_test.prototxt"
# テストイテレーション数
test_iter: 100
# 500トレーニングイテレーション毎にテスト
test_interval: 500
# 学習率・モーメンタム
base_lr: 0.001
momentum: 0.9
weight_decay: 0.004
# 学習率のポリシー
lr_policy: "fixed"
# 100 イテレーション毎に表示
display: 100
# イテレーション最大数
max_iter: 4000
ソルバー定義ファイル(例)
トレーニングの際に使用するパラメーターのリスト
DNNトレーニングアルゴリズムに渡される
64
Caffe
以下のコマンドで学習を開始
./build/tools/caffe train --solver=examples/cifar10/cifar10_quick_solver.prototxt
学習の実行
Caffeコマンド 学習時は”train”を指定 ソルバー定義
65
Theano
66
Theano
0から9の数字の手書き文字画像データ
28x28ピクセル、7000枚のグレースケール画像からなるデータセット
MNISTを用いた学習
67
Theano
Optimization complete. Best validation score of 98.397436 % obtained at iteration
6630, with test performance 98.387420 %
MNISTを用いた学習:実行結果
可視化すると1万回反復してトレーニングしている間に
重みが変化している事が分かる
最終的に分類精度は98%を超える
68
Torch7
69
Torch7
TorchベースのRNNを用いたテキスト生成
シェークスピア、トルストイ、オバマ大統領のスピーチ原稿作成者、Linux カーネルのソース コード作
成者のいずれかのスタイルでテキストを生成
リカレントニューラルネットワーク(RNN)を使ったテキスト生成
70
Torch7
Michelle, another defining place meant on the only time from the
United States is a few years we're continued here to live up to balance
on Ukraing; from Iraq.
Let me took off in, loans and the people of Hawaii will justify just like
a two. One of what reform can’t act as we can. Part of all the rights
of somebody as so they described another accomplishine between 15-
year believe.
So the quiet Republican orgence of broadband new majuri with our
head, a leader American had train and making '
実行結果:Style=obama
71
Torch7
CPU_DEBUG + this_cpu->expect->state = PM_SUSPEND_MAX);
}
static inline void torture_ops_trace_trace_clock(struct ring_buffer_event *event)
{
u64 rw = (struct cgroup_subsys_state *css && !LOCK_RMODED & fail);
return ret;
}
static void perf_string_print(struct timespec __user *, bin_niveltist Clock_vidch,
struct pid_namespace *ns, unsigned int idx)
{
unsigned long flags = a; if (handler_nid) return NULL;
if (atomic_dec_and_test(&jiffies))
put_futex_key := when allocate_st
実行結果:Style=linux
72
NVIDIA ディープラーニング学習コース
ディープラーニング・インスティチュートで今後公開予定のコース
1. TensorFlow入門
2. CNTK入門
3. Chainer入門
4. DIGITS中級講座
NVIDIA ディープラーニング・インスティチュート
73
参考
• ディープラーニング学習コース
• https://developer.nvidia.com/deep-learning-courses (学習コース/講義資料・録画)
• https://nvidia.qwiklab.com/lab_catalogue (ハンズオンラボ)
• Caffe
• http://caffe.berkeleyvision.org/ (公式)
• Torch
• http://torch.ch/ (公式)
• Theano
• http://deeplearning.net/software/theano/ (公式)
• TensorFlow
• http://tensorflow.org/ (公式)
• Chainer
• https://github.com/pfnet/chainer (公式)
• https://github.com/hido/chainer-handson (Jupyter Notebook)
• CNTK
• https://cntk.codeplex.com/ (公式)
ディープラーニング・フレームワーク関連サイト
Thank you!

More Related Content

What's hot

強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
DeNA
 

What's hot (20)

20161122 gpu deep_learningcommunity#02
20161122 gpu deep_learningcommunity#0220161122 gpu deep_learningcommunity#02
20161122 gpu deep_learningcommunity#02
 
これから始める人の為のディープラーニング基礎講座
これから始める人の為のディープラーニング基礎講座これから始める人の為のディープラーニング基礎講座
これから始める人の為のディープラーニング基礎講座
 
エヌビディアのディープラーニング戦略 TESLA P100 & NVIDIA DGX-1
エヌビディアのディープラーニング戦略 TESLA P100 & NVIDIA DGX-1エヌビディアのディープラーニング戦略 TESLA P100 & NVIDIA DGX-1
エヌビディアのディープラーニング戦略 TESLA P100 & NVIDIA DGX-1
 
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
 
DIGITS による物体検出入門
DIGITS による物体検出入門DIGITS による物体検出入門
DIGITS による物体検出入門
 
これから始める人のためのディープラーニング基礎講座
これから始める人のためのディープラーニング基礎講座これから始める人のためのディープラーニング基礎講座
これから始める人のためのディープラーニング基礎講座
 
ハンズオン1: DIGITS によるディープラーニング入門
ハンズオン1: DIGITS によるディープラーニング入門ハンズオン1: DIGITS によるディープラーニング入門
ハンズオン1: DIGITS によるディープラーニング入門
 
ChainerRL の学習済みモデルを gRPC 経由で使ってみる試み (+アルファ)
ChainerRL の学習済みモデルを gRPC 経由で使ってみる試み (+アルファ)ChainerRL の学習済みモデルを gRPC 経由で使ってみる試み (+アルファ)
ChainerRL の学習済みモデルを gRPC 経由で使ってみる試み (+アルファ)
 
1000: 基調講演
1000: 基調講演1000: 基調講演
1000: 基調講演
 
ハンズオン セッション 3: リカレント ニューラル ネットワーク入門
ハンズオン セッション 3: リカレント ニューラル ネットワーク入門ハンズオン セッション 3: リカレント ニューラル ネットワーク入門
ハンズオン セッション 3: リカレント ニューラル ネットワーク入門
 
なぜGPUはディープラーニングに向いているか
なぜGPUはディープラーニングに向いているかなぜGPUはディープラーニングに向いているか
なぜGPUはディープラーニングに向いているか
 
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
 
マイクロソフトが考えるAI活用のロードマップ
マイクロソフトが考えるAI活用のロードマップマイクロソフトが考えるAI活用のロードマップ
マイクロソフトが考えるAI活用のロードマップ
 
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
1018: ディープラーニング最新技術情報~cuDNN 3、DIGITS 2、CUDA 7.5のご紹介~
 
DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用DeNAにおける機械学習・深層学習活用
DeNAにおける機械学習・深層学習活用
 
Chainer でのプロファイリングをちょっと楽にする話
Chainer でのプロファイリングをちょっと楽にする話Chainer でのプロファイリングをちょっと楽にする話
Chainer でのプロファイリングをちょっと楽にする話
 
Deep Learning Lab: DIMo & Chainer
Deep Learning Lab: DIMo & ChainerDeep Learning Lab: DIMo & Chainer
Deep Learning Lab: DIMo & Chainer
 
NGC でインフラ環境整備の時間短縮!素早く始めるディープラーニング
NGC でインフラ環境整備の時間短縮!素早く始めるディープラーニングNGC でインフラ環境整備の時間短縮!素早く始めるディープラーニング
NGC でインフラ環境整備の時間短縮!素早く始めるディープラーニング
 
GTC 2018 で発表されたディープラーニング最新情報
GTC 2018 で発表されたディープラーニング最新情報GTC 2018 で発表されたディープラーニング最新情報
GTC 2018 で発表されたディープラーニング最新情報
 
TensorRT Inference Serverではじめる、 高性能な推論サーバ構築
TensorRT Inference Serverではじめる、 高性能な推論サーバ構築TensorRT Inference Serverではじめる、 高性能な推論サーバ構築
TensorRT Inference Serverではじめる、 高性能な推論サーバ構築
 

Similar to エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~

Similar to エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~ (20)

NVIDIA ディープラーニング入門
NVIDIA ディープラーニング入門NVIDIA ディープラーニング入門
NVIDIA ディープラーニング入門
 
1010: エヌビディア GPU が加速するディープラーニング
1010: エヌビディア GPU が加速するディープラーニング1010: エヌビディア GPU が加速するディープラーニング
1010: エヌビディア GPU が加速するディープラーニング
 
NVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NX
NVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NXNVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NX
NVIDIA Jetson Edge Computing Digital Seminar Special Edition, JETSON XAVIER NX
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
 
GPU と PYTHON と、それから最近の NVIDIA
GPU と PYTHON と、それから最近の NVIDIAGPU と PYTHON と、それから最近の NVIDIA
GPU と PYTHON と、それから最近の NVIDIA
 
NVIDIA 最近の動向
NVIDIA 最近の動向NVIDIA 最近の動向
NVIDIA 最近の動向
 
2016 06-30-deep-learning-archi
2016 06-30-deep-learning-archi2016 06-30-deep-learning-archi
2016 06-30-deep-learning-archi
 
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
「NVIDIA プロファイラを用いたPyTorch学習最適化手法のご紹介(修正版)」
 
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
 
Iccv2019 参加報告
Iccv2019 参加報告Iccv2019 参加報告
Iccv2019 参加報告
 
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄
 
20170921 日本生物物理学会 マイクロソフトのR&DクラウドとAI
20170921 日本生物物理学会 マイクロソフトのR&DクラウドとAI20170921 日本生物物理学会 マイクロソフトのR&DクラウドとAI
20170921 日本生物物理学会 マイクロソフトのR&DクラウドとAI
 
WeDX Flow Hands-on
WeDX Flow Hands-onWeDX Flow Hands-on
WeDX Flow Hands-on
 
JETSON 最新情報 & 自動外観検査事例紹介
JETSON 最新情報 & 自動外観検査事例紹介JETSON 最新情報 & 自動外観検査事例紹介
JETSON 最新情報 & 自動外観検査事例紹介
 
Dat002 ディープラーニン
Dat002 ディープラーニンDat002 ディープラーニン
Dat002 ディープラーニン
 
Jetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoTJetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoT
 
20170726 py data.tokyo
20170726 py data.tokyo20170726 py data.tokyo
20170726 py data.tokyo
 
Microsoft の深層学習への取り組み
Microsoft の深層学習への取り組みMicrosoft の深層学習への取り組み
Microsoft の深層学習への取り組み
 
3Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.13Dリッチコンテンツビジネス活用のご提案ver3.1
3Dリッチコンテンツビジネス活用のご提案ver3.1
 
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep LearningWatsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
 

More from NVIDIA Japan

More from NVIDIA Japan (20)

HPC 的に H100 は魅力的な GPU なのか?
HPC 的に H100 は魅力的な GPU なのか?HPC 的に H100 は魅力的な GPU なのか?
HPC 的に H100 は魅力的な GPU なのか?
 
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
 
Physics-ML のためのフレームワーク NVIDIA Modulus 最新事情
Physics-ML のためのフレームワーク NVIDIA Modulus 最新事情Physics-ML のためのフレームワーク NVIDIA Modulus 最新事情
Physics-ML のためのフレームワーク NVIDIA Modulus 最新事情
 
20221021_JP5.0.2-Webinar-JP_Final.pdf
20221021_JP5.0.2-Webinar-JP_Final.pdf20221021_JP5.0.2-Webinar-JP_Final.pdf
20221021_JP5.0.2-Webinar-JP_Final.pdf
 
開発者が語る NVIDIA cuQuantum SDK
開発者が語る NVIDIA cuQuantum SDK開発者が語る NVIDIA cuQuantum SDK
開発者が語る NVIDIA cuQuantum SDK
 
NVIDIA Modulus: Physics ML 開発のためのフレームワーク
NVIDIA Modulus: Physics ML 開発のためのフレームワークNVIDIA Modulus: Physics ML 開発のためのフレームワーク
NVIDIA Modulus: Physics ML 開発のためのフレームワーク
 
NVIDIA HPC ソフトウエア斜め読み
NVIDIA HPC ソフトウエア斜め読みNVIDIA HPC ソフトウエア斜め読み
NVIDIA HPC ソフトウエア斜め読み
 
HPC+AI ってよく聞くけど結局なんなの
HPC+AI ってよく聞くけど結局なんなのHPC+AI ってよく聞くけど結局なんなの
HPC+AI ってよく聞くけど結局なんなの
 
Magnum IO GPUDirect Storage 最新情報
Magnum IO GPUDirect Storage 最新情報Magnum IO GPUDirect Storage 最新情報
Magnum IO GPUDirect Storage 最新情報
 
データ爆発時代のネットワークインフラ
データ爆発時代のネットワークインフラデータ爆発時代のネットワークインフラ
データ爆発時代のネットワークインフラ
 
Hopper アーキテクチャで、変わること、変わらないこと
Hopper アーキテクチャで、変わること、変わらないことHopper アーキテクチャで、変わること、変わらないこと
Hopper アーキテクチャで、変わること、変わらないこと
 
GTC November 2021 – テレコム関連アップデート サマリー
GTC November 2021 – テレコム関連アップデート サマリーGTC November 2021 – テレコム関連アップデート サマリー
GTC November 2021 – テレコム関連アップデート サマリー
 
テレコムのビッグデータ解析 & AI サイバーセキュリティ
テレコムのビッグデータ解析 & AI サイバーセキュリティテレコムのビッグデータ解析 & AI サイバーセキュリティ
テレコムのビッグデータ解析 & AI サイバーセキュリティ
 
必見!絶対におすすめの通信業界セッション 5 つ ~秋の GTC 2020~
必見!絶対におすすめの通信業界セッション 5 つ ~秋の GTC 2020~必見!絶対におすすめの通信業界セッション 5 つ ~秋の GTC 2020~
必見!絶対におすすめの通信業界セッション 5 つ ~秋の GTC 2020~
 
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
2020年10月29日 プロフェッショナルAI×Roboticsエンジニアへのロードマップ
 
2020年10月29日 Jetson活用によるAI教育
2020年10月29日 Jetson活用によるAI教育2020年10月29日 Jetson活用によるAI教育
2020年10月29日 Jetson活用によるAI教育
 
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
2020年10月29日 Jetson Nano 2GBで始めるAI x Robotics教育
 
COVID-19 研究・対策に活用可能な NVIDIA ソフトウェアと関連情報
COVID-19 研究・対策に活用可能な NVIDIA ソフトウェアと関連情報COVID-19 研究・対策に活用可能な NVIDIA ソフトウェアと関連情報
COVID-19 研究・対策に活用可能な NVIDIA ソフトウェアと関連情報
 
Jetson Xavier NX クラウドネイティブをエッジに
Jetson Xavier NX クラウドネイティブをエッジにJetson Xavier NX クラウドネイティブをエッジに
Jetson Xavier NX クラウドネイティブをエッジに
 
GTC 2020 発表内容まとめ
GTC 2020 発表内容まとめGTC 2020 発表内容まとめ
GTC 2020 発表内容まとめ
 

Recently uploaded

Recently uploaded (7)

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 

エヌビディアが加速するディープラーニング~進化するニューラルネットワークとその開発方法について~