世界最性感的職業之一:資料科學家
近年來人工智慧與大數據的需求與應用大量崛起,衍伸出許多工作機會,在這之中「資料科學家」絕對是這波浪潮最夯的職缺之一,這幾年來在製造、醫學、服務、金融等產業更是積極尋找懂資料科學的相關人才。
在104人力銀行所公布的人才白皮書中,可以看出資料科學家職缺數成長的趨勢,從2015年700名職缺,到2020年直逼3000名職缺,成長幅度十分驚人!在國際知名的《哈佛商業評論》也特別提到資料科學家為21世紀最性感的職業之一。
關於資料科學家
一、整合大數據解決商業問題
身為一名優秀的資料科學家,必須要運用各式工具整合數據,透過數據分析、資料探勘、建立模型、模型評估等資料分析流程,將數據進行資料視覺化,並協助企業有效找出洞察,解決所遇到商業問題!
二、優於其他職務的薪資水準
根據美國商業智慧軟體公司SiSense指出,資料分析相關人才起薪相較大學畢業生平均年薪高出7400美元,而高薪資料科學家,平均年薪13.2萬美元,等同於500萬台幣!
三、資料分析人才供不應求
「大人物」在近年持續走紅,當「大」數據、「人」工智慧、「物」聯網之間的關係逐漸緊密,隨著科技不斷發展,所開發出的相關應用如雨後春筍般的冒出。在未來五年數據量將比過去成長4倍,企業資料相關人才也將供不應求,所有產業在未來都必需具備數據導向思維與技術。
資料科學家必備技能
身為一位資料科學家,你需要透過Python 來彙整數據,進而運用機器學習、深度學習來分析數據,並使用Power BI 進行視覺化,解決工作上的問題。而這些技能都可以透過一系列資料科學線上課程循序漸進學習。
以下整理六大資料科學家必備技能清單,讓想入門資料科學家的朋友可以快速了解:
- 程式語言:資料分析常用的程式語言如 R 或 Python
- 資料庫:資料庫查詢工具,比如 SQL
- 基礎統計學:利用數據進行決策以及設計、評估實驗與結果
- 機器學習:了解機器學習技術下手,如有監督式學習、決策樹、邏輯回歸等
- 數據清理:梳理龐大且複雜的數據
- 資料視覺化與溝通:把複雜的數據轉成圖像化並與主管進行溝通
可以參考的線上學習資源
如果想踏進資料科學的領域,要具備哪些技能?網路上該從哪些自學課程可以下手?想成為資料科學家又該去哪裡找工作呢?
接下來就分別以資料科學的自學線上課程進行重點介紹,把資料科學的技能點好點滿!
Python
如果你已學過Python程式語言,建議可以跳過此課程。如果沒學過Python,那你可以透過這堂精心設計的課程,從最基本的Python 概念開始學習,這些基礎概念將幫助你踏穩資料科學殿堂的基石,為你將來進行人工智慧的應用,如機器學習、數據分析、網路爬蟲,甚至是想成為軟體工程師、數據分析師、AI 科學家做好鋪墊,解決在學習時遇到的學習困難,實際完成程式實作。
連結:成為 AI 科學家|快速闖關 Python 語法世界,程式實作不頭痛
MySQL
帶你認識資料庫基本觀念、掌握 Workbench 工具和 SQL 語法去建立資料庫,並了解關聯式設計、主鍵、外來鍵、表格設計,以及運用其他相關語法,讓你具備 MySQL 資料庫所需要具備的專業知識,更加熟悉 MySQL。
網路爬蟲
資料蒐集是現今相當重要的工作項目之一,學會網路爬蟲的技巧後,我們可以避免效率低又耗時的方式蒐集網站資料,這門課將透過Python 以及抓取網頁資料的工具 BeautifulSoup 和 Selenium,來撰寫爬蟲程式自動化地蒐集網路上的最新資料,讓你快速完成資料擷取的工作!
資料探勘
這門課程帶你從數據輸入開始,學習對資料的清洗。清洗儲存完成後,可以開始著手分析,將分析結果以清晰易懂的圖表或圖形在螢幕或報表上展示。
分析方面,還會學到商場上最熱門的關聯性分析,並在 Numpy,Pandas,MatplotLib 等程式庫實作後,學到基本的迴歸預測,資料分類以及分群的原理與技巧。
連結:成為AI 科學家|資料探勘速成攻略,輕鬆駕馭資料分析與實務應用
機器學習-入門篇
學習基本的概念,以開始訓練機器學習模型。在這門機器學習的課程中,將詳細介紹分類模型的選擇與使用,對於數學不好的人,會透過詳盡解說演算法的每個步驟來補不足,對於實際進行模型訓練、參數調整與評估的注意事項,也會在這一門課中完整的帶你了解,除了認識機器學習概念之外,還可以實作出最完整的機器學習應用。
這門機器學習的課程中,將詳細介紹分類模型的選擇與使用,對於數學不好的人,會透過詳盡解說演算法的每個步驟來補不足,對於實際進行模型訓練、參數調整與評估的注意事項,也會在這一門課中完整的帶你了解,除了認識機器學習概念之外,還可以實作出最完整的機器學習應用。
連結:成為AI 科學家|機器學習好簡單,輕鬆讓你一手掌握資料科學實作10 大技巧
機器學習-影像處理篇
在工業的自動化系統中,常常發現機器學習的蹤跡,隨著機器學習的應用趨近普及,如何應用機器學習於產業當中就變得非常重要,這門課採用實作導向的方式來探討機器學習,老師將帶領你用機器學習來打造機器學習系統,並運用此技術解決資料科學、影像處理以及電腦視覺中所遭遇的不同問題。
連結:機器學習實戰_影像處理篇
深度學習
這門課程將帶你逐步累積深度學習的概念,從基本的 DNN 開始介紹,並逐次導入 CNN 與 RNN 等應用,透過 24 個實作範例,協助你解決不知該從哪些工具下手、該如何開始實作、如何整合資料等最實際迫切的深度學習問題。
在這個階段,你應該對資料科學家所需的技術,包含資料探勘、機器學習、深度學習技術與相關模型應該有一定程度的認知跟能力。在往後的學習之路上,很大程度上取決於你自己對資料科學的興趣,你可以選擇專注於回歸和時間序列等問題解決,或更深入地學習深度學習,了解如何實現和應用現有的不同體系結構。
連結:成為 AI 科學家|提升 AI 實作能力必備,深度學習 TensorFlow 基礎與應用
深度學習-影像辨識篇
本課程將從深度學習的理論出發,在近年來最受歡迎的深度學習框架-PyTorch上使用Python撰寫模型訓練、測試以及佈署程式。 實作的部份除了基本的影像分類外,還包括物件偵測、影像分割甚至是人臉生成等應用。 這門課的最終目標是能讓學員具備打造深度學習模型的能力,以解決電腦視覺中的各種任務。
連結:深度學習實戰_影像辨識篇
OpenCV
本門課程將從認識 OpenCV 與其他常見函式庫開始,接著逐漸帶到 OpenCV 的基本操作、繪圖、色彩、濾波器、直方圖等概念,並深入影像處理目的與實作,讓你探索出 OpenCV 的多種玩法,學會影像辨識、偵測、融合等技能。
連結:成為AI 科學家|動手玩OpenCV ,邁入影像辨識新視界
想成為資料科學家,如何快速累積作品?
除了透過線上課程學習技術以及搭配課程專題實作可以累積作品之外,透過資料科學平台 Kaggle或參加AI實戰吧,與團隊夥伴們一起參加競賽與累積作品也是很好的方式。
在人力銀行或求職平台應徵資料科學家時,企業會很想知道你在外面的實務經驗,這時候可以將過往參加競賽作品進行展示,並解釋自己如何去挖掘背後的問題,如何分析資料,這些都是在應徵資料科學家時很關鍵的keypoint!
Kaggle連結:https://www.kaggle.com/
AI實戰吧連結:https://tbrain.trendmicro.com.tw/
網路上是否有資料科學家的社群可以參與討論?
透過FB尋找並參加社團可以取得許多關於資料科學家相關職缺資訊,像是台灣人工智慧同好交流區、Data Science Meetup 台灣資料科學社群等FB社團,加入後可以看看大神們都在討論什麼議題,也可看到許多新知識與資訊,不論你是剛入行的新手,想要慢慢培養經驗,或者是有產業經驗的高手,都可以一起在社團裡交流討論。
期待大家都能透過這些學習資源,建立自己在資料科學相關的技術與能力。在學習過程中若發現自己對資料分析有很大的熱情,且可以有效運用資料分析相關工具去解決問題,之後可以考慮成為資料科學家。如果本身已是工程師也可透過學習資料分析應用及軟體解決工作上的問題。
建立完整學習路徑,成為資料科學家
如果你想要從零基礎開始建立資料科學的能力,那可以依照這張學習地圖進行學習,將所需的職能做拆解,分階段進行學習。
完整資料科學家學習地圖:https://bit.ly/3o4N39e
AI基礎力
完訓能力:
一、助管理者培養洞見,掌握趨勢先機
二、增進管理AI產品的相關知識,制定領域內相關流程
三、掌握人工智慧應用思維,與工程師及分析師高效溝通
必備職能:
AI/資料科學科普
AI技術力
完訓能力:
一、爬取網路文章並擷取圖片
二、自動化爬取資料
三、整理、過濾並結構化資料
四、資料預測與分析
如:股票走勢、房屋價格、貸款風險、顧客行為、用戶分群等
必備職能:
資料分析程式語言、資料庫、網路爬蟲、資料探勘、機器學習
AI應用力
完訓能力:
一、深入應用技術,瞭解各產業實務運作
二、完成深度分析並進行資料視覺化
三、在專業領域上能將資料進行相關運用
如:影像辨識、文字探勘、醫學影像分析等
必備職能:
影像辨識、深度學習、自然語言處理、資料視覺化