【AI60問】Q11人工智慧可以做到那些事?

by 提拔我園丁
緯育TibaMe AI小教室-Q11人工智慧可以做到哪些事?

人工智慧能做什麼?它對商業產生深遠的影響,目前最大的進展在兩大領域:感知(perception)與認知(cognition)。

在感知方面,AI最實用的進展在語音、圖像相關有很大突破,像是數百萬人使用的蘋果的Siri、Alexa和Google Assistant。或是我們最常使用的FB和部分App,可以進一步辨識出你發布照片中朋友的臉孔,並跳出提醒,讓你標記他們的名字。圖像辨識甚至取代企業總部中的身分識別證。

另一個貼近生活的例子,像是你出去玩時,隨時可以開啟智慧手機的App,能快速認出野外的動植物。 又或是我們外出上高速公路ETC收費、出入停車場的車牌感應,透過部分特徵擷取、像素運算來進行各種影像識別。

在認知和問題解決方面也有重大突破,機器在撲克牌和圍棋方面,擊敗最優秀的人類高手。

Google的DeepMind團隊使用機器學習系統,改善數據中心的冷卻效率達15%以上;網絡安全公司Deep Instinct也使用智能代理,偵測惡意軟體;PayPal也用智能代理防範洗錢。

許多公司甚至使用機器學習,決定要在華爾街執行哪些交易,而且在它的協助之下,做成更多信用決策。Amazon也使用機器學習,來優化存貨,且改善對顧客的產品建議。數據科學平台公司Lumidatum的一套系統,即時提供建議,來改善顧客支持。

很多事情雖然沒有達到人工智慧的機能,但它可以有「深度學習」作為基礎,以下分享10個人工智慧做得到,但你想不到的例子。

1、人工智慧其實有藝術設計天份

我們曾以為人工智慧是很理性的東西,但它其實具有藝術設計天份。

美是可以用數學的方式被定義,機器在這個過程是學會圖像的低階特徵,包含筆觸;高階特徵有光影、結構,把這樣的特徵抽取出來,再放回到照片當中,你能透過把各式特徵,以機器抽取再放回,就能變成漂亮的視覺藝術。

機器有創作能力,但沒有創作動機,其實很多東西,他是透過隨機概念來產生,在這個過程中,也帶來新的可能性。人跟機器協作的成果,人跟機器協作,機器上百份產生的一個設計稿,人就是從這之中挑出好看的,機器可以把美給抽取出來,融入到照片當中,但機器不知道美醜,因為醜也是一種風格。

在未來的工作模式會發生改變,原本畫圖的工作會受到限制,因為機器可以用更快速高效的方式來生產,但具有美感的人,他不會在未來失去工作。

2、人工智慧能幫你無窮放大你的模糊照片

一般認為照片只要放大就會模糊,會有很多鋸齒狀,但未來會被打破這樣的常識。

若照片不清楚,人工智慧幫你無窮放大就好,以Adobe Camera Raw團隊開發的超級解析度(Super Resolution)功能,任何照片放大會模糊,先拿一張原本高解析度的圖片,把另外高解析圖片縮小再放大,就會變成模糊照片,先讓機器學習這兩者之間的關係。只要告訴機器:「未來你看到這個模糊照片,以後要把他補為清楚樣子」,機器能學習彼此關聯。

人類的認知中有很重要的能力,就是我們能從殘缺的數據中,得到完整的判斷,這是人的特性。機器也可以,雖然像素模糊,但可以透過周遭構圖、顏色的線索,我們可以讓機器還原本來的細節。

它可以帶來很大的產業變化,不需要再追求手機硬體配置,可以用普通配置的照相機,把圖片無窮放大成為高解析度的效果,將造成硬體很大的革命。

3、人工智慧可以把黑白影片的世界變為彩色

過去的老電影、老影片都是黑白片,沒有色彩信息,我們可以看到人工還原版,都是用人工一幀一幀的把它變為彩色。

但現在,我們可以透過電影色彩與黑白影片結合,將色彩丟到模型中,機器可以用所學的視覺效果,自動幫我們完成上色動作。

圖片出自:觀察者網

未來在電影工業上,人工智慧看起來可以幫我們很大的忙,在影片修復的公司裡,不需要再用人工老師傅一格格畫出數位還原版。

4、馬賽克其實也可以還原

馬賽克是嚴重的信息缺失,因為他把整個臉都擋住,但能用馬賽克的臉告訴機器,你必須要還原成完整的臉。

被馬賽克掉的臉,機器無法還原,不過機器可以按照五官其他部分去「推測最有可能」的長相是什麼,為了讓臉的正面側面角度,以及人的種族,加入臉的五官的預測。機器要先預測可能的五官,必須根據已經遮掉的五官,去推測可能的長相,最後推測需要被修復的區域。

不過,遮掉馬賽克不可能百分百還原,有可能補回來的臉不是原本的人。若你用它來去修復特殊影片,他不見得是原本的臉。

5、人工智慧可以看穿素顏

許多神奇的美妝Youtuber,都有化妝前後的差距,我們可以做一個模型,把美妝模組的影片抓下來,原本素顏的臉擷取出來、畫完全妝的臉,讓機器去學兩者關係。透過這樣的模型,機器知道給他化妝的臉,他就會自動把他還原成素顏。

但需要更大的樣本數量,才可以訓練更精確,透過模型,臉上的妝少掉一大半,這個可以把很多殘缺的數據當中,還原回原狀。人跟機器共有的感知能力,他可以應用在很多原本想不到之處。如:交友軟體,放上這樣的功能,會成為有趣的模式。

6、輕輕鬆鬆換臉或換聲音

在深度學習中,換臉、換聲音都是輕而易舉,如:館長跟女網紅的臉互換

裡面最大的困難技術點,過去大多數影像轉換必須要有成對數據,但問題是得不到館長跟女網紅他們一模一樣的動作成對數據,這個則利用CycleGan的技術,既然得不到成對數據就做兩個模型,一個是把館長變女人、另一個把女人變館長。

雖然得不到成對數據,但可以把館長照片轉為女人再轉為館長,前後兩個館長一樣,就解決沒有成對數據的問題,訓練完成後,同時得到了館長變女人、女人變館長的兩個模型。不只是影像,包含聲音 Deepmind的WaveNet,都可以連你講話、呼吸的換氣聲都可以模仿。

兩個技術結合,未來看到的不一定為真,聽到的也不一定為真,真假難辨,會是未來明確的趨勢。

7、普通相機也能夠判斷景深

我們都有一個常識是說,一般相機拍就是一個RGB的照片,RGB照片是沒有景深的概念,所以你可能會需要透過雙目視覺的相機,或有紅外光的相機,才能知道深度。

我們可以把這樣的關聯讓機器去學,拍攝很多的RGB跟D景深這樣的對應關係,然後我們就教機器,「當你看到這樣的畫面,就要去補這樣的景深。」利用這樣的畫面結果,再利用學習算法,把畫面中的景深轉移成為一個點3D的點雲,機器就可以立刻轉為3D的模型。

過去一個3D建模要消耗的成本非常昂貴,未來的世界裡面,透過機器學習,可以用一個一般的普通相機,到可以一步到位去完成3D立體模型。未來可以用更低的成本,去拍攝自己的3D影片,或製作更多的AR/VR素材。

8、人在做,洋芋片在聽

以往我們在屋內講話,屋外的人有辦法竊聽嗎?一般常識告訴我們說,若我們沒裝竊聽器,在屋子外的人怎會知道?

微軟跟MIT卻說做得到,他們透過一台高速攝影機,是一個超高幀率的攝影機,基本上就是每秒幾千幀的一個頻率,去拍攝你屋內的一些物體,在裡面測試一下,包含你們盆景、盆栽、洋芋片、水杯都可以,只不過洋芋片效果是最好的。

根據洋芋片在高速攝影機他的震動,我們可以把抽取出這個震動波紋,因為高幀的攝影機,可以知道它的震動情況,把這樣的頻率,透過深度學習模型,可以還原出你們對話內容。凡走過必留下痕跡,你周遭的洋芋片、周遭的小物體,都會根據你的話而產生對應的運動。

在過去人類沒有這樣的數學能力,可以把這麼細微的東西給抽取出來,現在有了人工智慧、深度學習,可以把這些大家想不到的東西能還原回來,未來對資安這件事好像真的是一個嚴重的考驗,也會影響未來對安全的定義。

9、你在牆壁後的行動,人工智慧都看得到

當你把窗戶都封起來,當你走到牆後,機器仍可以知道你在牆後的行為。

MIT的技術,透過WiFi訊號,由於人體百分之七十是水,可以根據屋內的WiFi訊號被吸收的情況來推動我們人的行為。

未來的世界好像什麼東西都藏不住,連WiFi訊號都可以知道一舉一動。

10、股市的漲停,人工智慧可能看得比你更清楚

過去大家都透過數學統計模型、量化交易來去做股市預測,通常效果不好。

舉例來說,台灣漲跌幅就是10%,也就是說你什麼都不做,準確率也有百分之90%,在這裡面你做出很多模型,其實都沒辦法,幫你預測未來的漲停,所以最後還是50:50,沒有任何實質幫助。

深度學習可以幫我們抽絲剝繭,找到更細節的東西。跟廠商合作的結果,傳統都是用數字去判斷漲跌,而人工的trader,他們每天盯著圖、手不停下單,所以我們能發現整個交易機制,是視覺加上行動的過程。

能不能將機器學會看K線圖?讓它自己去找到圖裡面的特徵。不是用一般的序列數據的方式來預測股價,我們去讓機器來理解K線圖,機器可以生成未來十天的K線圖。這樣的預測其實跟傳統的數值上的預測不一樣,一般的序列數據,只要錯一個後面就一路錯,但它是一個時間序列,在我們的模型中,卻是一次生成未來十天的K線圖。K線圖是一個有邏輯的圖表,不但要正確地還原出未來的走勢,必須要符合K線圖的規範,雖然現在模型不太能到非常清晰,但看出未來時間會漲會停即可。

機器不可能幫你做決策

目前來說,雖然機器掌握未來十天,可以偷看未來十天K線圖,機器還不是可能幫你做縱橫股海的決策。股市投資絕不是一個,你知道會漲會跌就可解決的問題。它包含很多資金、部位、怎樣去做你的倉位,都是一些很縝密的人工,需要用人來去判斷一些策略。

我們能透過人與機器協作的方式,讓機器告訴你未來會發生什麼事,人來決定在這樣的情況下,怎麼組合可以達到最優的效果。

妥善運用機器,成為關鍵能力

我們不用害怕人工智慧會取代我們人類,但我們能透過人工智慧的應用,給機器數據來學習,它可以變成很好的工具。當人懂得學會如何讓機器來為你做事,讓它變成個人競爭力的致勝原因。

緯育TibaMe已經有10萬人次來學習AI/資料科學知識或技術,若你想進一步了解或學習 AI / 資料科學的相關知識或技能,歡迎來TibaMe 👉 https://www.tibame.com/eventpage/ai_datascientist 

AI資料科學家-三階段全方位學程班
AI資料科學家-三階段全方位學程班

下篇會為大家介紹人工智慧做不到那些事

每週4則,每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。

若您想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或你有其他想了解的主題歡迎在下方留言讓我們知道唷!

緯育TibaMe FB 

企業人才數位轉型FB

參考資料

分享這篇文章:
0 留言
3

您也許會喜歡

發佈留言

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料