【AI60問】Q35什麼是深度學習?

by 提拔我園丁
緯育TibaMe AI小教室-Q35什麼是深度學習?

深度學習是機器學習的一種方法。「機器學習技術,就是讓機器可以自我學習的技術。」

一、深度學習的類型

但實際上機器是如何學習的呢?

更白話來說,機器學習就是讓機器根據一些訓練資料,自動找出有用的函式(function)。
例如,將機器學習技術運用在語音識別系統,就是要機器根據一堆聲音訊號和其對應的文字,找出如下的「語音識別函式」:

圖35-1

輸入一段聲音訊號,輸出就是該聲音訊號所對應的文字。

如果機器學習技術應用在影像識別系統,那就是要機器根據一堆圖片和圖片中物件名稱的標註,找出「影像識別函式」: 

圖35-2

輸入一張圖片,輸出是圖片中的物件名稱。 如果要機器下圍棋,就是讓機器根據一堆棋譜找出「下圍棋的函式」: 

圖35-3

輸入是棋盤上所有黑子和白子的位置,輸出是下一步應該落子的位置。以上要找的函式,共通點是它們都複雜到人類絕對沒有能力寫出它們的數學式,只有靠機器才有辦法找出來。

那麼,機器要如何根據訓練資料找到函式呢?

一般機器學習方法要經過三個步驟:

1.人類提供給機器一個由函式構成的集合(簡稱函式集)。
2.人類根據訓練資料定義函式的優劣。
3.機器自動從函式集內找出最佳的函式。深度學習也不例外。

*註:深度學習的三步驟,將在下一章節Q36-深度學習中的類神經網路是什麼細部與大家說明

二、深度學習的演算法

至今已有數種深度學習框架:

1、深度神經網路

深度神經網路 (Deep Neural Networks) ,是一種判別模型,可以使用反向傳播演算法進行訓練。權重更新可以使用下式進行隨機梯度下降法求解;如果僅僅是簡單地訓練,深度神經網路可能會存在很多問題。常見的兩類問題是過擬合和過長的運算時間。

2、深度置信網路

深度置信網路(deep belief networks,DBN),是一種包含多層隱單元的概率生成模型,可被視為多層簡單學習模型組合而成的複合模型。深度置信網路可以作為深度神經網路的預訓練部分,並為網路提供初始權重,再使用反向傳播或者其它判定演算法作為調優的手段。

3、卷積神經網路

卷積神經網路(convolutional neural networks,CNN),是一個很好的計算機科學借鑒神經科學的例子。

它的精髓其實是在多個空間位置尚共用參數。由一個或多個卷積層和頂端的全連通層(對應經典的神經網路)組成,同時也包括關聯權重和池化層(pooling layer)。

這一結構使得卷積神經網路能夠利用輸入資料的二維結構。與其他深度學習結構相比,卷積神經網路在圖像和語音辨識方面能夠給出更優的結果。這一模型也可以使用反向傳播演算法進行訓練。相比較其他深度、前饋神經網路,卷積神經網路需要估計的參數更少,使之成為一種頗具吸引力的深度學習結構。

4、卷積深度置信網路

卷積深度置信網路(deep belief networks)是深度學習領域較新的分支。在結構上,卷積深度置信網路與卷積神經網路在結構上相似。因此,與卷積神經網路類似,卷積深度置信網路也具備利用圖像二維結構的能力,與此同時,卷積深度信念網路也擁有深度置信網路的預訓練優勢。卷積深度置信網路提供了一種能被用於訊號和圖像處理任務的通用結構,也能夠使用類似深度置信網路的訓練方法進行訓練。

深度學習應用在電腦視覺、語音辨識、自然語言處理、音訊辨識與生物資訊學等領域並取得了極好的效果。

【相關課程】提升 AI 實作能力必備,深度學習 TensorFlow 基礎與應用

三、深度學習的訓練 (Training) 三步驟

1.定義網路架構(define network structure)
2.定義學習目標(define learning target)
3.透過數值方法(Numerical method)進行訓練

深度學習和類神經網路的網路架構,可以想成是一組可用來描述資料的函數(Function),只要找到正確的函數參數,就可以透過這個函數把我們輸入的資料轉化成預測(Prediction)結果。定義網路架構就是先選出一群可能的函數,來進行接下來的深度學習訓練過程。定義了適當的網路架構才能透過訓練過程來產生一個有效的深度學習模型(Model)。

四、深度學習應用場域

深度學習應用很多領域,尤其是在電腦視覺和語音辨識中,成為各種領先系統的一部分。

在通用的用於檢驗的資料集,例如:語音辨識中的TIMIT和圖像辨識中的ImageNet, Cifar10上的實驗證明,深度學習能夠提高辨識的精度。

1、製造業的應用

深度學習技術被用於工業機器人,機器視覺系統等,以改善工藝和產品品質,最小化週期時間,並提高整個製造過程的效率。

2、在亞太地區應用

中國是最大的AI市場,其次是日本。應用於用於證券交易的演算法,醫療保健患者數據管理和影像識別等應用。

3、健康管理應用

綜觀各界推動深度學習的應用方向,最饒富價值與商機的一塊,無疑便是健康管理。

例如:未來人們只要在浴室洗澡,透過衛浴鏡,即可量測其生理狀態訊息,並持續將相關資料上傳雲端平台,接著由專業醫護單位負責解析數據,期望爭取時效在第一時間察覺到人體的病變徵兆,即時給予投藥與診療,避免人們的健康與生命。

4、車用電子應用

藉由車內影像辨識裝置,可監測駕駛人的臉部表情,進而推估其脈搏與呼吸頻率,據此研判此人的健康或精神狀態是否出問題,以便於後台管理中心適時妥善處理,防止車禍事件產生。

5、圖像辨識應用

已經衍生出多項應用,「自動駕駛(Automated Driving)」是最廣為人知的一項應用。

6、語音辨識應用

Google 語音助理、 Siri 以及亞馬遜的 Alexa 現在已經能夠清楚地辨識我們的聲音與講話內容,靠的就是深度學習中「自然語言處理」的分支技術,藉由大量的文本資料搭配音訊數據,透過音樂的波長、聲音斷句、語調的頓挫,將類比資訊轉為數位音訊進行分析訓練,進而讓程式能夠辨認人類的說話內容和文法結構。

想成為爬蟲工程師 、資料分析師 、資料工程師 、資料分析領域專家 、人工智慧產品經理嗎?還是你的公司正需要培養此領域人才呢?

點我了解 AI資料科學家-三階段全方位學程班 👉 https://www.tibame.com/eventpage/ai_datascientist 

每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。

若想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或有其他想了解的主題歡迎在下方留言讓我們知道唷!

參考資料

分享這篇文章:
0 留言
3

您也許會喜歡

發佈留言

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料