Google首席執行長Sundar Pichai:「設計神經網路相當耗時,它對專業知識有極高要求,使得只有少數科研人員和工程師才能參與設計。這就是我們創建AutoML方法的原因,有了它,神經網路也可以設計神經網路。」
Pichai所說的使用「神經網路也可以設計神經網路」就是神經網路結構搜尋;通常使用強化學習或進化演算法來設計新的神經網路結構。
神經網路結構搜尋通常需要大量計算力,它讓我們能發現比人們想像得要複雜多的網路結構,且這些結構可以針對特定目標來優化。準確地來說,神經網路搜尋多半涉及學習像層(單元),它們可以組裝成一堆重複的單元來創建神經網路。
2017年5月 Google I/O大會,Google AI研究人員發表最新研究成果,什麼是機器學習自動建模 AutoML?
2018年3月 TensorFlow DevSummit 大會,Google大腦團隊領導人 Jeff Dean在演講中稱,在未來Google可能會用100倍的計算能力取代機器學習專家,他也以需要龐大計算力的神經網路結構搜尋作為範例,說明為什麼我們需要100倍的計算能力才讓更多人使用ML。
*AutoML=自動機器學習,
專注於自動化機器學習(ML)工作流程的各方面,以提高效率,
並帶來了機器學習民主化,讓非專家也能輕鬆地將機器學習應用於他們的問題。
一般來說,術語AutoML用在描述模型選擇或超參數優化的自動化方法,這些方法適用在許多類型的演算法,例如:隨機森林、梯度提升機器(gradient boosting machines)、神經網路…等。
AutoML領域包含:開源AutoML庫、研討會、研究、比賽。初學者常常在爲模型測試不同的超參數時,通常只靠猜測,而這部分過程的自動化,可讓機器學習變得更容易。即使是對經驗豐富的機器學習專家來說,這個自動化過程也可以加快他們的速度。
神經網路結構搜尋是AutoML領域的一部分,最核心問題是:該如何將模型選擇和超參數優化過程自動化?然而,自動化忽視了人類參與的重要作用。
但是,選擇模型只是構建機器學習産品複雜過程中的一部分。在大多數情況下,網路結構選擇並不是最重要的問題。目前沒有證據能夠證明每個問題最好用它自己獨特的網路結構來建模,大多數業者都認爲不太可能會出現這種情況。
Google致力於網路結構設計,並與其他人共用他們發現的網路結構,這樣的服務是重要且有用的。 然而,只有那些致力於基礎神經結構設計的小部分研究人員才需要基礎架構搜尋方法,我們其他人可以透過遷移學習來利用他們找到的網路結構。
【相關課程】機器學習實戰-影像處理篇
*參數 與 超參數?
參數:就是模型可以。比如:深度學習的權重、偏差...等
超參數:用來確定模型的一些參數,超參數不同,模型是不同的
(這個模型不同的意思就是有微小的區別,
比如假設都是CNN模型,
若層數不同,模型不一樣,雖然都是CNN模型),
超參數一般就是在深度學習中,
超參數有:學習速率、迭代次數、層數、每層神經元的個數...等等。
人類和電腦該如何合作,能使機器學習效率更高?
增強機器的重點在於弄清楚人和機器該如何更好地合作,來發揮他們的不同優勢。
舉一個增強機器學習的例子,Leslie Smith的學習率查詢器。
它可以在Fastai 庫(在PyTorch之上運行的高級API)中實現。學習率是一個超參數,可以確定模型訓練的速度,甚至可以確定模型是否訓練成功。學習速率查詢器允許人類透過查看生成的圖表中,找到合適的學習速率。它比AutoML更快地解決了這一問題,增強資料科學家對訓練過程的理解,並鼓勵採用更強大的多步驟方法來訓練模型。
專注在自動化超參數選擇存在的另一個問題是:它忽視了某些類型的模型可能適用性更廣,需要調整的超參數更少以及對超參數選擇不太敏感的情況。
例如:隨機森林優於梯度提升機器(Grandient Boosting Machine, GBM)的重要一點是隨機森林更加穩定,而GBM對超參數的微小變化相當敏感。因此,隨機森林在業內得到廣泛應用。研究有效刪除超參數的方法(透過更智慧的預設值或新模型)將産生巨大的影響。
【相關課程】輕鬆掌握資料科學實作 10 大技巧
想成為爬蟲工程師 、資料分析師 、資料工程師 、資料分析領域專家 、人工智慧產品經理嗎?還是你的公司正需要培養此領域人才呢?
點我了解 AI資料科學家-三階段全方位學程班 👉 https://www.tibame.com/eventpage/ai_datascientist
每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。
若想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或有其他想了解的主題歡迎在下方留言讓我們知道唷!
參考資料