Submit Search
Upload
WaveNet
•
1 like
•
779 views
T
TanUkkii
Follow
社内LTで発表した資料です 日本語が表示されない問題はまだ健在しているのですね
Read less
Read more
Technology
Report
Share
Report
Share
1 of 15
Download now
Download to read offline
Recommended
2016/9/16 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]Wavenet a generative model for raw audio
[DL輪読会]Wavenet a generative model for raw audio
Deep Learning JP
2013-06-23 PRML復々習レーン#11 前回までのあらすじ
PRML復々習レーン#11 前回までのあらすじ
PRML復々習レーン#11 前回までのあらすじ
sleepy_yoshi
- ICLR2016 - accept papers - 2/8に発表された採録論文の中個人的に興味あるものを一言コメント付きでまとめました - アブストだけで内容判断してるので知識不足等から誤りがあった場合は適宜修正します
[ICLR2016] 採録論文の個人的まとめ
[ICLR2016] 採録論文の個人的まとめ
Yusuke Iwasawa
Title: "On Causal and Anticausal Learning" Conf.: ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12
Yusuke Iwasawa
2013-06-23 PRM復々習レーン#11 7.1.5 計算論的学習理論 の発表資料
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
輪読, Vapnik, 蒸留, ICLR2016, privileged information, 特権情報, DL Hacks, 機械学習,
Dl hacks輪読: "Unifying distillation and privileged information"
Dl hacks輪読: "Unifying distillation and privileged information"
Yusuke Iwasawa
- Authors: Mingsheng Long, Yue Cao, Jianmin Wang, Michel I. Jordan - Conf: ICML2015
[DL Hacks] Learning Transferable Features with Deep Adaptation Networks
[DL Hacks] Learning Transferable Features with Deep Adaptation Networks
Yusuke Iwasawa
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
NAVER D2
Recommended
2016/9/16 Deep Learning JP: http://deeplearning.jp/seminar-2/
[DL輪読会]Wavenet a generative model for raw audio
[DL輪読会]Wavenet a generative model for raw audio
Deep Learning JP
2013-06-23 PRML復々習レーン#11 前回までのあらすじ
PRML復々習レーン#11 前回までのあらすじ
PRML復々習レーン#11 前回までのあらすじ
sleepy_yoshi
- ICLR2016 - accept papers - 2/8に発表された採録論文の中個人的に興味あるものを一言コメント付きでまとめました - アブストだけで内容判断してるので知識不足等から誤りがあった場合は適宜修正します
[ICLR2016] 採録論文の個人的まとめ
[ICLR2016] 採録論文の個人的まとめ
Yusuke Iwasawa
Title: "On Causal and Anticausal Learning" Conf.: ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12
Paper Reading, "On Causal and Anticausal Learning", ICML-12
Yusuke Iwasawa
2013-06-23 PRM復々習レーン#11 7.1.5 計算論的学習理論 の発表資料
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
輪読, Vapnik, 蒸留, ICLR2016, privileged information, 特権情報, DL Hacks, 機械学習,
Dl hacks輪読: "Unifying distillation and privileged information"
Dl hacks輪読: "Unifying distillation and privileged information"
Yusuke Iwasawa
- Authors: Mingsheng Long, Yue Cao, Jianmin Wang, Michel I. Jordan - Conf: ICML2015
[DL Hacks] Learning Transferable Features with Deep Adaptation Networks
[DL Hacks] Learning Transferable Features with Deep Adaptation Networks
Yusuke Iwasawa
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
NAVER D2
DL輪読会, Deep Mind, Deep Learning, Nature
[DL輪読会] Hybrid computing using a neural network with dynamic external memory
[DL輪読会] Hybrid computing using a neural network with dynamic external memory
Yusuke Iwasawa
ICML読み会で冒頭に発表したスライドです. http://connpass.com/event/34960/
ICML2016読み会 概要紹介
ICML2016読み会 概要紹介
Kohei Hayashi
DL輪読会, Generative Adversarial Nets, Deep Learning, ICLR, NIPS
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
Yusuke Iwasawa
Source code: https://github.com/uosdmlab/tensorflow-tutorial 2016년 11월 14일에 서울시립대학교 대학원 수업에서 진행한 텐서플로 걸음마 슬라이드입니다. 한국에서 출판된 "텐서플로 첫걸음"이라는 책을 바탕으로 만들었습니다. TensorFlow에 대한 간략한 설명과 5가지 예제 코드를 다룹니다. 특히 그 중 MNIST 데이터셋을 CNN으로 분류하는 과정을 자세히 설명했습니다 ^^
텐서플로 걸음마 (TensorFlow Tutorial)
텐서플로 걸음마 (TensorFlow Tutorial)
Taejun Kim
ICML2016 読み会で Pixel RNN を紹介した際のスライドです。
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks
Seiya Tokui
발표 영상 : https://goo.gl/jrKrvf 데모 영상 : https://youtu.be/exXD6wJLJ6s Deep Q-Network, Double Q-learning, Dueling Network 등의 기술을 소개하며, hyperparameter, debugging, ensemble 등의 엔지니어링으로 성능을 끌어 올린 과정을 공유합니다.
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
Taehoon Kim
PDF를 받아서 보시면 깨끗하게 보입니다.
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
Taehoon Kim
DCGAN, Neural Turing Machine, Deep Q Network, Visual Analogy
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
Taehoon Kim
チャットワークのメッセージシステムを支える新分散ID発行器の内部
Distributed ID generator in ChatWork
Distributed ID generator in ChatWork
TanUkkii
title: ノンブロッキングIOで分散システム を手懐ける ーチャットワークでのasynchbaseの利用 event: LINE Developer Meetup in Tokyo #28 - JVM非同期プログラミング - https://line.connpass.com/event/78912/
Non-blocking IO to tame distributed systems ー How and why ChatWork uses async...
Non-blocking IO to tame distributed systems ー How and why ChatWork uses async...
TanUkkii
ChatWorkの新ScalaバックエンドFalconのアーキテクチャ
Architecture of Falcon, a new chat messaging backend system build on Scala
Architecture of Falcon, a new chat messaging backend system build on Scala
TanUkkii
lightnig talk for NodeFest 2016
JSON CRDT
JSON CRDT
TanUkkii
Scala Kansai summit 2016で発表した資料です
Akka Clusterの耐障害設計
Akka Clusterの耐障害設計
TanUkkii
Scala将軍達の後の祭りLT
スケールするシステムにおけるエンティティの扱いと 分散ID生成
スケールするシステムにおけるエンティティの扱いと 分散ID生成
TanUkkii
2016/3/4 @Akkaを語る会
Akka HTTP
Akka HTTP
TanUkkii
Reactive Shinjuku meetup #2 LT
すべてのアクター プログラマーが知るべき 単一責務原則とは何か
すべてのアクター プログラマーが知るべき 単一責務原則とは何か
TanUkkii
社内勉強会で発表したディープニューラルネットの入門資料です
ディープニューラルネット入門
ディープニューラルネット入門
TanUkkii
ハッカーズチャンプルー2015のLTで発表した資料です。
プログラミング言語のパラダイムシフト(ダイジェスト)ーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフト(ダイジェスト)ーScalaから見る関数型と並列性時代の幕開けー
TanUkkii
2015 6/19 に社内勉強会で発表した資料です
プログラミング言語のパラダイムシフトーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフトーScalaから見る関数型と並列性時代の幕開けー
TanUkkii
isomorphic tokyo meetupで発表した資料です
Isomorphic web development with scala and scala.js
Isomorphic web development with scala and scala.js
TanUkkii
Option型についての解説です。
Scalaによる型安全なエラーハンドリング
Scalaによる型安全なエラーハンドリング
TanUkkii
2014/10/29のES6+カジュアルトークで発表した資料です。
ECMAScript6による関数型プログラミング
ECMAScript6による関数型プログラミング
TanUkkii
More Related Content
Viewers also liked
DL輪読会, Deep Mind, Deep Learning, Nature
[DL輪読会] Hybrid computing using a neural network with dynamic external memory
[DL輪読会] Hybrid computing using a neural network with dynamic external memory
Yusuke Iwasawa
ICML読み会で冒頭に発表したスライドです. http://connpass.com/event/34960/
ICML2016読み会 概要紹介
ICML2016読み会 概要紹介
Kohei Hayashi
DL輪読会, Generative Adversarial Nets, Deep Learning, ICLR, NIPS
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
Yusuke Iwasawa
Source code: https://github.com/uosdmlab/tensorflow-tutorial 2016년 11월 14일에 서울시립대학교 대학원 수업에서 진행한 텐서플로 걸음마 슬라이드입니다. 한국에서 출판된 "텐서플로 첫걸음"이라는 책을 바탕으로 만들었습니다. TensorFlow에 대한 간략한 설명과 5가지 예제 코드를 다룹니다. 특히 그 중 MNIST 데이터셋을 CNN으로 분류하는 과정을 자세히 설명했습니다 ^^
텐서플로 걸음마 (TensorFlow Tutorial)
텐서플로 걸음마 (TensorFlow Tutorial)
Taejun Kim
ICML2016 読み会で Pixel RNN を紹介した際のスライドです。
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks
Seiya Tokui
발표 영상 : https://goo.gl/jrKrvf 데모 영상 : https://youtu.be/exXD6wJLJ6s Deep Q-Network, Double Q-learning, Dueling Network 등의 기술을 소개하며, hyperparameter, debugging, ensemble 등의 엔지니어링으로 성능을 끌어 올린 과정을 공유합니다.
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
Taehoon Kim
PDF를 받아서 보시면 깨끗하게 보입니다.
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
Taehoon Kim
DCGAN, Neural Turing Machine, Deep Q Network, Visual Analogy
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
Taehoon Kim
Viewers also liked
(8)
[DL輪読会] Hybrid computing using a neural network with dynamic external memory
[DL輪読会] Hybrid computing using a neural network with dynamic external memory
ICML2016読み会 概要紹介
ICML2016読み会 概要紹介
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
[DL輪読会] GAN系の研究まとめ (NIPS2016とICLR2016が中心)
텐서플로 걸음마 (TensorFlow Tutorial)
텐서플로 걸음마 (TensorFlow Tutorial)
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
텐서플로우 설치도 했고 튜토리얼도 봤고 기초 예제도 짜봤다면 TensorFlow KR Meetup 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
지적 대화를 위한 깊고 넓은 딥러닝 PyCon APAC 2016
More from TanUkkii
チャットワークのメッセージシステムを支える新分散ID発行器の内部
Distributed ID generator in ChatWork
Distributed ID generator in ChatWork
TanUkkii
title: ノンブロッキングIOで分散システム を手懐ける ーチャットワークでのasynchbaseの利用 event: LINE Developer Meetup in Tokyo #28 - JVM非同期プログラミング - https://line.connpass.com/event/78912/
Non-blocking IO to tame distributed systems ー How and why ChatWork uses async...
Non-blocking IO to tame distributed systems ー How and why ChatWork uses async...
TanUkkii
ChatWorkの新ScalaバックエンドFalconのアーキテクチャ
Architecture of Falcon, a new chat messaging backend system build on Scala
Architecture of Falcon, a new chat messaging backend system build on Scala
TanUkkii
lightnig talk for NodeFest 2016
JSON CRDT
JSON CRDT
TanUkkii
Scala Kansai summit 2016で発表した資料です
Akka Clusterの耐障害設計
Akka Clusterの耐障害設計
TanUkkii
Scala将軍達の後の祭りLT
スケールするシステムにおけるエンティティの扱いと 分散ID生成
スケールするシステムにおけるエンティティの扱いと 分散ID生成
TanUkkii
2016/3/4 @Akkaを語る会
Akka HTTP
Akka HTTP
TanUkkii
Reactive Shinjuku meetup #2 LT
すべてのアクター プログラマーが知るべき 単一責務原則とは何か
すべてのアクター プログラマーが知るべき 単一責務原則とは何か
TanUkkii
社内勉強会で発表したディープニューラルネットの入門資料です
ディープニューラルネット入門
ディープニューラルネット入門
TanUkkii
ハッカーズチャンプルー2015のLTで発表した資料です。
プログラミング言語のパラダイムシフト(ダイジェスト)ーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフト(ダイジェスト)ーScalaから見る関数型と並列性時代の幕開けー
TanUkkii
2015 6/19 に社内勉強会で発表した資料です
プログラミング言語のパラダイムシフトーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフトーScalaから見る関数型と並列性時代の幕開けー
TanUkkii
isomorphic tokyo meetupで発表した資料です
Isomorphic web development with scala and scala.js
Isomorphic web development with scala and scala.js
TanUkkii
Option型についての解説です。
Scalaによる型安全なエラーハンドリング
Scalaによる型安全なエラーハンドリング
TanUkkii
2014/10/29のES6+カジュアルトークで発表した資料です。
ECMAScript6による関数型プログラミング
ECMAScript6による関数型プログラミング
TanUkkii
社内勉強会で発表したScalaの入門的内容です
プログラミング言語Scala
プログラミング言語Scala
TanUkkii
2014/9/5にLIG社で行われたWebフロント勉強会で発表した資料です。
これからのJavaScriptー関数型プログラミングとECMAScript6
これからのJavaScriptー関数型プログラミングとECMAScript6
TanUkkii
More from TanUkkii
(16)
Distributed ID generator in ChatWork
Distributed ID generator in ChatWork
Non-blocking IO to tame distributed systems ー How and why ChatWork uses async...
Non-blocking IO to tame distributed systems ー How and why ChatWork uses async...
Architecture of Falcon, a new chat messaging backend system build on Scala
Architecture of Falcon, a new chat messaging backend system build on Scala
JSON CRDT
JSON CRDT
Akka Clusterの耐障害設計
Akka Clusterの耐障害設計
スケールするシステムにおけるエンティティの扱いと 分散ID生成
スケールするシステムにおけるエンティティの扱いと 分散ID生成
Akka HTTP
Akka HTTP
すべてのアクター プログラマーが知るべき 単一責務原則とは何か
すべてのアクター プログラマーが知るべき 単一責務原則とは何か
ディープニューラルネット入門
ディープニューラルネット入門
プログラミング言語のパラダイムシフト(ダイジェスト)ーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフト(ダイジェスト)ーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフトーScalaから見る関数型と並列性時代の幕開けー
プログラミング言語のパラダイムシフトーScalaから見る関数型と並列性時代の幕開けー
Isomorphic web development with scala and scala.js
Isomorphic web development with scala and scala.js
Scalaによる型安全なエラーハンドリング
Scalaによる型安全なエラーハンドリング
ECMAScript6による関数型プログラミング
ECMAScript6による関数型プログラミング
プログラミング言語Scala
プログラミング言語Scala
これからのJavaScriptー関数型プログラミングとECMAScript6
これからのJavaScriptー関数型プログラミングとECMAScript6
Recently uploaded
2024年5月8日 Power Platform 勉強会 #1 LT資料
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Syed Talal Wasim, Muzammal Naseer, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan , "Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Grounding" arXiv2024 https://arxiv.org/abs/2401.00901v2
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
Key topics covered: - Understanding Ballerina's role in integrations: features and advantages - Designing and implementing REST APIs for integration - Designing and implementing GraphQL services with Ballerina - Monitoring and observing applications - Introduction to data integration
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
NewSQLの可用性構成パターン (OCHaCafe Season 8 #4 発表資料) 2024年5月8日(水) NTTデータグループ 技術開発本部 小林 隆浩
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
This is an introduction to MAPPO's paper.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
Jue Wang, Wentao Zhu, Pichao Wang, Xiang Yu, Linda Liu, Mohamed Omar, Raffay Hamid, " Selective Structured State-Spaces for Long-Form Video Understanding" CVPR2023 https://openaccess.thecvf.com/content/CVPR2023/html/Wang_Selective_Structured_State-Spaces_for_Long-Form_Video_Understanding_CVPR_2023_paper.html
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
LoRaWANスマート距離検出センサー DS20Lカタログ
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
2022年10月27日に社内向けに開催した勉強会資料の社外公開版です(発表8分程度)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Recently uploaded
(12)
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
WaveNet
1.
WaveNet 安田裕介
2.
WaveNetとは? DeepMindが開発したDNNを使った 音響データ生成モデル https://arxiv.org/pdf/1609.03499.pdf
3.
WaveNetの驚きポイント • 従来の手法よりも自然な音声を生成 • 特徴抽出やvocoderがいらない.入力も出力も音響波. •
同じアーキテクチャで音声だけでなく音楽も生成可能 • RNNではなくCNNを使っている
4.
従来の音声合成
5.
WaveNetの中身
6.
音響波の同時確率 • 音響波形は過去の履歴に依存する • 音響波は過去に取ったすべての値の 条件付き確率の同時確率で表せる
7.
causal convolution • causal
convolutionでは予測 は未来の値に依存しない • 条件付き確率分布はレイヤーの積み重ねで表現される • 出力層は入力層と同じ次元tをもつ • ソフトマックス層で256の値に分類される
8.
dilated convolution • dilated
convolutionは入力を何ステップかスキップする • dilated convolutionは少ない層数で大きな受容野をもつことを可能にする • 受容野とは神経細胞の中で入力を受け取る部分 • 実験では受容野の大きさはおよそ300ミリ秒で、23音素分に相当 受容野
9.
CNNのメリット/デメリット • 再帰的コネクションを持っていないため、RNNよ りも学習が速い • 受容野を広げるためにたくさんの層や巨大なフィル ターが必要
10.
条件付きWaveNet • 音響データ以外に入力を与えることもできる • 入力変数で条件付けすることで、特定の特徴をもった音 響波を出力することができる •
条件にはグローバル条件(e.g. 話者)と時系列のローカ ル条件(e.g. 言語学的情報)がある
11.
実験結果
12.
複数話者音声生成 • 109話者44時間のデータを学習 • 話者IDで条件付け •
テキストでは条件付けしていない • →人の声のように聞こえるが、意味のない発言 • →1つのモデルですべての話者を再現可能 • →呼吸、口の動き、録音環境も再現される https://deepmind.com/blog/wavenet-generative-model-raw-audio/
13.
TTS • 1話者、24時間のデータを学習 • 入力テキストの言語学的情報で条件付け •
他のモデルで予測したF0と音素継続長も補助情報 として条件付け • →ユニットセレクションやHMM/LSTM-RNNパラ メトリック合成よりもよいスコア
14.
音楽生成 • ジャンルや楽器などでタグ付けされた200時間の 音楽/60時間のYoutubeにあるピアノ音楽を学習 • →無条件でも和音で構成された聞き心地のよい音楽 を生成 •
→数秒の受容野をもってしても長期間の整合性は維 持できない(秒単位でジャンルや楽器が変わってし まう)
15.
感想 • 現実的に情報量が多く汎用性の高い強力なモデルを 作ることが可能なところがすごい • F0や音素継続長など長期依存性をもつものは従来 の手法を使わなければならないのが残念 •
受容野の拡大に期待 • tensorflow/magentaで実装公開に期待
Download now