SlideShare a Scribd company logo
1 of 34
Download to read offline
影像辨識技術探討
Orozco Hsu
2017-06-19
大綱
• 影像處理過程
• 常用的演算法
• 深度學習 (影像辨識)
• 應用案例
影像處理過程
• 由實體擷取影像進行處理、分析、量測與
解釋相關實體資訊
前處理
• 改善影像品質,使影像更適合後續處理
影像分割
• 把影像中的目標物從原影像中獨立出來
表示與描述 (1)
• 定義該物件特徵值
表示與描述 (2)
• 顏色
• 紋理
表示與描述 (3)
• 位置
• 綜合
傳統影像辨識方法
影像處理過程之三階段
• 低階處理
– 過濾雜訊、增強對比、影像解析度
• 中階處理
– 影像分析、抓取特徵值
• 高階處理
– 電腦視覺、物件辨識、自動分類
數位影像內容 (1)
x
y
影像 像素 特徵值座標
顏色值(單色、彩色)
總像素 = X 方向 * Y 方向像素 (640 X 480 = 307200)
數位影像內容 (2)
• 轉換成影像矩陣
矩陣相似度計算
• 影像標籤學習
– 歐氏距離
– 曼哈頓距離
– 切比雪夫距離
– 閔可夫斯基距離
– 標準化歐氏距離
– 馬氏距離
– 夾角餘弦
– 漢明距離
– 傑卡德距離 & 傑卡德相似係數
– 相關係數 & 相關距離
– 信息熵
P
icture
S
imilarity
Algorithm
• 1.
• 當
• 影像
• 分割成網格區域數量增加
• ,
• 推論所得相似度
• 計算準確率相對增
• 加
• 。
• 2.
• 當
• 影像
• 分割成
• 100
• 網格區域時
• ,
• 使用相似度計算新
• 方法所推論的相似度計算準確率達
• 80%
• 。
• 3.
• 提出的
• 影像
• 相似度計算方法同時考量距離相似效
• 應與夾角相似效應
• ,
• 相似度鑑別能力遠比單獨考量距
• 離相似效應或夾角相似效應的結果更佳
• 。
2010
機光電研討會論文論文集
深度學習與CNN (1)
• 類神經網路
• 三個 input 資料
深度學習與CNN (2)
• 手寫數字辨識系統
– MNIST 資料集 (http://yann.lecun.com/exdb/mnist/)
深度學習與CNN (3)
• 圖示轉換成矩陣
總像素 = 18 X 18 = 324
深度學習與CNN (4)
• 以 324 個輸入點作為深度學習 input資料
• 分別告訴系統正確的答案,以建立模型
• 最終模型能將結果輸出
深度學習與CNN (5)
• 但仍有許多問題需要解決
深度學習與CNN (6)
• Convolution Neural Network
– 解決物件轉換 (translation invariance)的差異
• 將圖片某種程度的重複切割 (小影像)
深度學習與CNN (7)
• 將每張小影像當作 input 資料集 (學習特徵
值)
• 將所有結果儲存起來,稱之為 convolution
array
深度學習與CNN (8)
• 將 convolution array 擷取重要資訊,將矩陣
縮小
– 採用 max pooling
參考來源: https://en.wikipedia.org/wiki/Convolutional_neural_network#Pooling_layer
深度學習與CNN (9)
• 縮小後的陣列,就當作 input 的資料集,進
行影像辨識作業
• 總結流程
– Convolution、Max-pooling、Fully-connected
深度學習與CNN (10)
• 一張照片,經過數個 Convolution 與 max
pooling 方式,最後得到分類結果
• 然而,機器學習會自動找出最佳的處理方
式
練習實作 (1)
• 建立鳥類的分類器
– 下載資料集 (https://www.cs.toronto.edu/~kriz/cifar.html),其中包
含 6000 張鳥類照片與 52000 張非鳥類照片
– 額外增加鳥類照片(http://www.vision.caltech.edu/visipedia/CUB-200-
2011.html),包含 12000張鳥類照片
請注意,此資料集數量仍是少數樣本,如果需要更準確的結果,需要有幾百萬張樣本才是
練習實作 (2)
• 採用 TFLearn (http://tflearn.org/)
• Deep learning library featuring a higher-level
API for TensorFlow
– Easy-to-use and understand high-level API for implementing
deep neural networks, with tutorial and examples.
– Fast prototyping through highly modular built-in neural network
layers, regularizers, optimizers, metrics...
– Full transparency over Tensorflow. All functions are built over
tensors and can be used independently of TFLearn.
– Powerful helper functions to train any TensorFlow graph, with
support of multiple inputs, outputs and optimizers.
– Easy and beautiful graph visualization, with details about
weights, gradients, activations and more...
– Effortless device placement for using multiple CPU/GPU.
練習實作 (3)
• 下載相關 github 程式集
• 查看結果
Facebook 應用案例 (1)
• Facebook 採用 FBLearner Flow AI 技術
– 數十億張照片作為訓練來源
– 不需要影像標籤
– 目前有約200個視覺模型,可用於不良內容偵測、
垃圾郵件、自動為圖片增加說明,甚至可辨識出行
為,如:人走動、跳舞、騎馬、彈奏樂器
– 應用於圖像搜尋系統,強化圖片搜尋的排序與精準
度,以確保搜尋系統真正理解圖片的實際內容
– 下一步是將Lumos的電腦視覺能力運用到影片中
發表於: 2017-02-03
Facebook 應用案例 (2)
• 圖像標示系統
圖像裡可能有2 個人、微笑的人
Azure 應用案例
• Face Verification
Caffe 應用案例
• Caffe 深度學習套
件
– C++/ CUDA 架構,
支援 python 語言
– 上手快、速度快、
模組化、開源
http://demo.caffe.berkeleyvision.org/
HP 應用案例
• HP (Tesseract)
– OCR (圖片中的文字進行識別獲取)
– 由 HP 實驗室開發後,交給 google 維護的開源
ORC 專案,目前版本 3.04
Google 應用案例 (1)
• Google Cloud Vision
– 文字辨識以外,還能認出圖像中的物件, 就和
運用在 Google 照片中的技術一樣,Google 宣稱
這套演算法能辨識上千種不同物品,包括水果、
食物、動物、建築
Google 應用案例 (2)
• Google Cloud Vision/ Tesseract-OCR
– 強悍!中華備戰經典賽 澳洲移訓”火力猛”
– 機捷試乘 機捷開放民眾試乘 預辦登機同步試辦
– 南韓三星李在鎔出庭 示威民眾在法院前抗議

More Related Content

Similar to Computer vision introduction

Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作kewuc
 
從 NN 到 嗯嗯
從 NN 到 嗯嗯從 NN 到 嗯嗯
從 NN 到 嗯嗯Heng-Xiu Xu
 
openGauss DBMind.pdf
openGauss DBMind.pdfopenGauss DBMind.pdf
openGauss DBMind.pdfwot chin
 
A brief introduction to Machine Learning
A brief introduction to Machine LearningA brief introduction to Machine Learning
A brief introduction to Machine LearningWen-Tien Chang
 
微服務架構 導入經驗分享 吳剛志 - Community Open Camp
微服務架構 導入經驗分享 吳剛志 - Community Open Camp微服務架構 導入經驗分享 吳剛志 - Community Open Camp
微服務架構 導入經驗分享 吳剛志 - Community Open CampAndrew Wu
 
全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用建興 王
 
Elastic stack day-1
Elastic stack day-1Elastic stack day-1
Elastic stack day-1YI-CHING WU
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统Dong Lin
 
Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318FEG
 
[students AI workshop] Pytorch
[students AI workshop]  Pytorch[students AI workshop]  Pytorch
[students AI workshop] PytorchTzu-Wei Huang
 
無標記擴增實境實驗平台建置與追蹤技術驗證
無標記擴增實境實驗平台建置與追蹤技術驗證無標記擴增實境實驗平台建置與追蹤技術驗證
無標記擴增實境實驗平台建置與追蹤技術驗證Tehuan Chung
 
VPU&Teachable Machine介紹
VPU&Teachable Machine介紹VPU&Teachable Machine介紹
VPU&Teachable Machine介紹YOU SHENG CHEN
 
LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長
LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長
LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長International Federation for information integration
 
09 文档管理实施步骤与案例
09 文档管理实施步骤与案例09 文档管理实施步骤与案例
09 文档管理实施步骤与案例Yeong-Long Chen
 
做一个“懒惰”的程序员-LCP框架系列交流
做一个“懒惰”的程序员-LCP框架系列交流做一个“懒惰”的程序员-LCP框架系列交流
做一个“懒惰”的程序员-LCP框架系列交流lichengdongdong
 
運用MMLSpark 來加速Spark 上 機器學習專案
運用MMLSpark 來加速Spark 上機器學習專案運用MMLSpark 來加速Spark 上機器學習專案
運用MMLSpark 來加速Spark 上 機器學習專案Herman Wu
 
01_智慧英文評分系統 Evaluate Student Summaries
01_智慧英文評分系統 Evaluate Student Summaries01_智慧英文評分系統 Evaluate Student Summaries
01_智慧英文評分系統 Evaluate Student SummariesIttrainingIttraining
 

Similar to Computer vision introduction (20)

Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作Geo science cafe 如何找到一份满意的工作
Geo science cafe 如何找到一份满意的工作
 
從 NN 到 嗯嗯
從 NN 到 嗯嗯從 NN 到 嗯嗯
從 NN 到 嗯嗯
 
openGauss DBMind.pdf
openGauss DBMind.pdfopenGauss DBMind.pdf
openGauss DBMind.pdf
 
A brief introduction to Machine Learning
A brief introduction to Machine LearningA brief introduction to Machine Learning
A brief introduction to Machine Learning
 
LabView with Lego NXT
LabView  with Lego NXTLabView  with Lego NXT
LabView with Lego NXT
 
微服務架構 導入經驗分享 吳剛志 - Community Open Camp
微服務架構 導入經驗分享 吳剛志 - Community Open Camp微服務架構 導入經驗分享 吳剛志 - Community Open Camp
微服務架構 導入經驗分享 吳剛志 - Community Open Camp
 
全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用
 
Elastic stack day-1
Elastic stack day-1Elastic stack day-1
Elastic stack day-1
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统
 
Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318
 
Kinect+sdk
Kinect+sdkKinect+sdk
Kinect+sdk
 
[students AI workshop] Pytorch
[students AI workshop]  Pytorch[students AI workshop]  Pytorch
[students AI workshop] Pytorch
 
無標記擴增實境實驗平台建置與追蹤技術驗證
無標記擴增實境實驗平台建置與追蹤技術驗證無標記擴增實境實驗平台建置與追蹤技術驗證
無標記擴增實境實驗平台建置與追蹤技術驗證
 
VPU&Teachable Machine介紹
VPU&Teachable Machine介紹VPU&Teachable Machine介紹
VPU&Teachable Machine介紹
 
LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長
LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長
LWC19 影像資料的徵集歷程;北藝大的經驗分享 報告人:國立臺北藝術大學圖書館採編組吳雅慧組長
 
09 文档管理实施步骤与案例
09 文档管理实施步骤与案例09 文档管理实施步骤与案例
09 文档管理实施步骤与案例
 
做一个“懒惰”的程序员-LCP框架系列交流
做一个“懒惰”的程序员-LCP框架系列交流做一个“懒惰”的程序员-LCP框架系列交流
做一个“懒惰”的程序员-LCP框架系列交流
 
運用MMLSpark 來加速Spark 上 機器學習專案
運用MMLSpark 來加速Spark 上機器學習專案運用MMLSpark 來加速Spark 上機器學習專案
運用MMLSpark 來加速Spark 上 機器學習專案
 
01_智慧英文評分系統 Evaluate Student Summaries
01_智慧英文評分系統 Evaluate Student Summaries01_智慧英文評分系統 Evaluate Student Summaries
01_智慧英文評分系統 Evaluate Student Summaries
 

More from FEG

Sequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdfSequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdfFEG
 
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdfFEG
 
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdfFEG
 
2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practices2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practicesFEG
 
2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratch2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratchFEG
 
2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratchFEG
 
2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratch2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratchFEG
 
2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_Rules2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_RulesFEG
 
202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)FEG
 
202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis Visualization202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis VisualizationFEG
 
Transfer Learning (20230516)
Transfer Learning (20230516)Transfer Learning (20230516)
Transfer Learning (20230516)FEG
 
Image Classification (20230411)
Image Classification (20230411)Image Classification (20230411)
Image Classification (20230411)FEG
 
Google CoLab (20230321)
Google CoLab (20230321)Google CoLab (20230321)
Google CoLab (20230321)FEG
 
Supervised Learning
Supervised LearningSupervised Learning
Supervised LearningFEG
 
UnSupervised Learning Clustering
UnSupervised Learning ClusteringUnSupervised Learning Clustering
UnSupervised Learning ClusteringFEG
 
Data Visualization in Excel
Data Visualization in ExcelData Visualization in Excel
Data Visualization in ExcelFEG
 
6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdf6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdfFEG
 
5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdf5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdfFEG
 
4_Regression_analysis.pdf
4_Regression_analysis.pdf4_Regression_analysis.pdf
4_Regression_analysis.pdfFEG
 
3_Decision_tree.pdf
3_Decision_tree.pdf3_Decision_tree.pdf
3_Decision_tree.pdfFEG
 

More from FEG (20)

Sequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdfSequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdf
 
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
 
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
 
2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practices2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practices
 
2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratch2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratch
 
2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch
 
2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratch2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratch
 
2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_Rules2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_Rules
 
202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)
 
202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis Visualization202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis Visualization
 
Transfer Learning (20230516)
Transfer Learning (20230516)Transfer Learning (20230516)
Transfer Learning (20230516)
 
Image Classification (20230411)
Image Classification (20230411)Image Classification (20230411)
Image Classification (20230411)
 
Google CoLab (20230321)
Google CoLab (20230321)Google CoLab (20230321)
Google CoLab (20230321)
 
Supervised Learning
Supervised LearningSupervised Learning
Supervised Learning
 
UnSupervised Learning Clustering
UnSupervised Learning ClusteringUnSupervised Learning Clustering
UnSupervised Learning Clustering
 
Data Visualization in Excel
Data Visualization in ExcelData Visualization in Excel
Data Visualization in Excel
 
6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdf6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdf
 
5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdf5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdf
 
4_Regression_analysis.pdf
4_Regression_analysis.pdf4_Regression_analysis.pdf
4_Regression_analysis.pdf
 
3_Decision_tree.pdf
3_Decision_tree.pdf3_Decision_tree.pdf
3_Decision_tree.pdf
 

Computer vision introduction