你不可不知的機器學習應用2. About Me
吳君孝 Shaw Wu
現職:資料科學家 / 正在創業家
簡單介紹:
熱愛資料科學跨領域研究,推廣資料科學及實作研究,以資料解決真實世界的問
題為目標。專長為組織執行、策略規劃、資料分析與視覺化。平常從事「大數據」
與「資料科學」跨領域技術研發,喜愛跨領域研究,涵蓋農業、廣告代言媒合、
新媒體、警政、環保、食安、經濟等應用研究。
更多講者資訊:https://tw.linkedin.com/in/shaw-wu-887489a8
Mail聯絡方式:shaldrem@gmail.com
Facebook:https://www.facebook.com/shaw.wu
2
10. What is 機器學習?
• 「機器學習」是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預
測的各類演算方法。
• 機器學習主要研究領域偏向人工智慧科學,擅長運用數據或以往的經驗,優化演
算性能,並能在經驗學習中不斷改善。
• 除了應用在資料庫處理問題上,也廣泛應用在影像辨識與機器人學上。
• 機器學習可分為監督式學習、非監督式學習、半監督式學習、與加強式學習。
10
16. 16
Raw Data
Data Sets
Statistical Analysis
Exploration Analysis
Predictive Analytics
Recommend Analysis
Value
Big Data
Data Science
Service Feedback
u =
u
u
u
u
u
u
u
u
u
u
u
u
u
u
u
© Copyright Application & Data Service Section of INSTITUTE FOR INFORMATION INDUSTRY Corporation 2015.
18. 深度機器學習(Deep Learning)的相關應用
1. 幫圖片上色
2. 產生特定風格的音樂(巴薩諾瓦(Bossa Nova)、頌讚曲)
3. 破解帳號密碼
4. 壓縮資料
5. 識別瀕危物種
6. 推薦受歡迎圖像
7. 讓模糊照片變清晰
8. 自動產生特定風格的劇本.
10 More Cool Deep Learning Applications | Two Minute Papers
https://www.youtube.com/watch?v=hPKJBXkyTKM
18
21. 教機器人走路
Robot trains with Q-Learning and an artificial neural network (reinforcement learning)
主要是藉由定義各個狀態以及動作和適當的指導(給予獎勵、懲罰),機器人即會循序漸進的從無到有學會執
行某項任務的演算法。
https://www.youtube.com/watch?v=fHCm0gQRzC4
https://www.youtube.com/watch?v=1MUQ9UiLRBo
機器蛇爬桌子
https://www.youtube.com/watch?v=PnCCd5rMRAM
21
28. 音樂自產
• Google A.I. just created music (CNET Update)
https://www.youtube.com/watch?v=3OEmzI52stk
• Daddy‘s Car: a song composed by Artificial Intelligence - in the style of the Beatles (Sony)
https://www.youtube.com/watch?v=LSHZ_b05W7o
• Jukedeck歌曲自產軟體
https://www.youtube.com/watch?v=xxDo3I00NJs
28
29. 無人機基本介紹
29
第 1 種:「遙控飛機」(Remotely Piloted Aircraft)
駕駛不坐在機艙內,而是在一定距離以外(地面上或另外一架飛
機裡)透過無線電遙控操縱飛機。大部分的遙控飛機是以真實飛
機或直升機機身尺寸按比例縮小,主要供作娛樂或訓練用途,但
也有些是以退役的戰鬥機或客機改裝而成。雖然無線電波的傳送
距離在理想條件下可以達到好幾十公里,不過一般遙控飛機的操
作範圍都是在視線距離之內,以策安全。
第 2 種:「無人飛行載具 UAV」(Unmanned Aerial Vehicle)
為近年來全球科技界競相投入的領域。一架功能完整的 UAV,包
括了機身載具、推進動力、航電飛控、任務酬載以及地面控制等
次系統,以及相關的系統整合能力,因此更貼切的稱呼應該是
「無人飛行系統 UAS」(Unmanned Aerial System)。
第 3 種:「飛行機器人系統」(Aerial Mobile Robotic System)
除了具備上述 UAV 功能外,還具備人工智慧,可自主學習、適應
作業環境、修正行為模式,甚至可和其他飛行機器人分工合作。
32. 移動機器人田間伺服器 The mobile robotic Field Server, robo-FS
32
• 運動單元:
在目標田間中移動
• 田間服務器單元:
用來遠端操控系統運作
• 操縱器單元:
用來測量目標
robo-FS保存在基站裡面的非接觸式充電底座中
• FS攝影機:
提供熱力圖或影像資料
,輔助其運作機制
33. 戶外穀類作物的高通量表型分析 High throughput phenotyping for cereal
crops in outdoor conditions
33
n 日 本 利 用 機 器 學 習 (machine
learning)的方式,提出可利用圖
像分析穀類作物,以加快表型分析,
並將此圖像三切,以探究戶外穀類
作物表型
n 如,從不同的自然光照背景條件下,
以固定地面攝影機平台或無人機拍
攝影像,並透過DTSM組合作物分
割方法,將作物影像分割,來檢測
水稻的開花情況
39. 機器學習應用在徵信上-美國 ZestFinance
39
以美國為例 傳統信用風險評估 基於大數據的信用評估
代表企業 FICO ZestFinance
服務對象 85%有豐富信貸紀錄者適用 可涵蓋至15%缺乏或無信貸紀錄者
資料結構 結構化資料 結構化資料與非結構化資料
資料類型 信貸資料 信貸資料+網路資料+社群資料+特徵資料
理論基礎 邏輯迴歸 機器學習
變量特徵 還款紀錄、金額、貸款類別 傳統數據、IP地址、電話帳單、社群行為
資料來源 銀行提交給第三方的資料和
銀行當地資料
第三方資料(電話帳單、租賃歷史等)和借
貸本身提供的資料
變量個數 15~30(變量庫400~1000) 多達幾千到上萬
信貸
資料
統計
迴歸
機器
學習
社群
行為
信貸
40. 美國 Obama EPA Rule:探討燃煤電廠分布預測
40
事件觸發
應用主題
• 美國歐巴馬的環境保
護法規(Obama‘s
EPA Rule)上路
• 美國古老燃煤電廠面
臨退休潮
資料分析
模式建立
• 探討歐巴馬環境保護
法規施行前後,燃煤
電廠分布之變化
• 收集、處理燃煤電廠、
有毒物質排放等相關
數據
• 預測未來五年間燃煤
電廠變化
視覺互動
時空融合
• 結合地圖與時間軸之
概念之應用
• 以歐巴馬環境保護法
規施行日做為分水嶺,
透過良好互動呈現的
方式來表達施行前後
燃煤電廠的分布概況
連結網址→
42. 可辨識影片內容的特定物件- Google Cloud Video Intelligence API
Google透過深度學習技術打造的雲
端影音智慧應用程式介面 (Cloud
Video Intelligence API)。它可以精
準地找出每段影音中特定物件出現
的時間點,或者也可以用於挖掘出
同類型影音內容。
例如搜尋「花」,資料庫中所有出
現「花」的相關影片都會被標列出
來。
未來可能會應用在數位廣告產業,
建立媒體分類、並也更有效地做內
容管理和應用,或是在這樣的基礎
上發展出更多的變化。
42https://cloud.google.com/video-intelligence/
52. 想學機器學習的話,可以看的參考資料
• 機器學習:
機器學習速遊 林軒田
機器學習基石 林軒田
An Introduction to Statistical Learning G. James/D. Witten/T. Hastie/R. Tibshirani
Pattern Recognition and Machine Learning C. M. Bishop
Elements of Statistical Learning T. Hastie/R. Tibshirani/J. Friedman
• 深度學習:
李宏毅的課程資料 李宏毅
Neural Networks and Deep Learning Michael Nielsen
A Guide to Deep Learning by YN2 有許多連結
DeepLearning 0.1 documentation
Deep Learning I. Goodfellow/Y. Bengio/A. Courville
fast.ai
UFLDL教程 Andrew Ng
52
54. 總結
• 機器學習的應用很多,值得學習與投入思考。
• 資料的本質還是要搞清楚,不然不是錯誤就
是無用。
• 機器學習的未來,大者恆大,小者只能靠速
度、創意和專精求生存。
• 機器學習只是解決問題的其中一種方法,不
要為了用而用。
• 還是鼓勵大家多投入實作,從實作中可以獲
得的更多。(參加黑客松是強迫自己產出的
好方法)
54
Raw Data
Data Sets
Statistical Analysis
Exploration Analysis
Predictive Analytics
Recommend Analysis
Value
Big Data
Data Science
Service Feedback
u =
u
u
u
u
u
u
u
u
u
u
u
u
u
u
u
© Copyright Application & Data Service Section of INSTITUTE FOR INFORMATION INDUSTRY Corporation 2015.