一、什麼是資料視覺化
資料視覺化 Data visualization,涉及到資料的視覺化表示的建立和研究,為了清楚有效來傳遞資訊,資料視覺化使會使用統計圖形、圖表、資訊圖表和其他工具。可以使用點、線或對數字資料進行編碼,好讓視覺上傳達定量的資訊,而有效的視覺化可以幫助使用者分析和推理資料和證據,也讓複雜的資料更容易理解和使用。
視覺化的三個主要學科分支:科學視覺化、 資訊視覺化和可視分析學,而將這三個分支整合在一起形成新學科「資料視覺化」,這是視覺化研究領域的新起點。廣義的資料視覺化涉及:資訊技術、自然科學、統計分析、圖形學、交互、地理資訊…等多種學科。
以下將介紹三個主要學科分支、如何實現資料視覺化、及10個常用的資料視覺化工具。
1、科學視覺化
科學視覺化是科學之中的一個跨學科研究與應用領域,主要關注三維現象的視覺化,如:建築學、氣象學、醫學或生物學方面的各種系統,重點在於對體、面及光源…等等的逼真渲染。
目的是以圖形方式說明科學資料,讓科學家能夠從資料中理解、說明和蒐集規律。
2、資訊視覺化
資訊視覺化是研究抽象資料的互動式視覺表示以加強人類認知。
抽象資料有數位和非數位資料,如地理資訊與文本。而柱狀圖、趨勢圖、流程圖、樹狀圖…等,都屬於資訊視覺化,這些圖形的設計,都將抽象的概念轉化成為視覺化資訊。
*資料視覺化輔助工具
主要透過程式設計和非程式設計兩類工具來完成
Excel:可以進行各種資料處理、統計分析、輔助決策操作,它是常用的資料處理和展現工具。
它自帶數據分析功能,可以完成部分專業統計軟體(R、SPSS、SAS、Matlab)的數據分析工作。
BI工具:BI是通過收集資料來影響業務決策的做法,
這幾年許多BI工具興起,像是:PowerBI、Qilkview都強調視覺化。
Python:它在視覺化的工具中,有很多優秀的第三方庫,
如:Matplotlib,Seaborn、Plotly、Boken、Pyecharts…等。
(詳情可參考Q15學習資料分析必備的9大技能?)
3、可視分析學
是隨著科學視覺化和資訊視覺化發展而成的新領域,主要是透過互動式視覺介面進行分析推理。
二、如何實現資料視覺化
在技術上,資料視覺化最簡單的理解,就是資料空間到圖形空間的映射。
通常一個視覺化實現流程,是先對資料進行加工、過濾,轉變成視覺可表達的形式(Visual Form),然後再轉化成使用者可看見的視圖(View)。
視覺化技術
專業的資料視覺化工程師,通常需要掌握以下7大技術:
- 基礎數學:三角函數、線性代數、幾何演算法
- 圖形相關:CANVAS、SVG、WebGL、計算圖形學、圖論
- 工程演算法:基礎演算法、統計演算法、常用的佈局演算法
- 資料分析:資料清洗、統計學、資料建模
- 設計美學:設計原則、美學評判、顏色、交互、認知
- 視覺化基礎:視覺化編碼、可視分析、圖形交互
- 視覺化解決方案:圖表的正確使用、常見的業務視覺化場景
三、常用的資料視覺化工具
一般使用者會使用Excel,學術界通常使用Python、R語言、ggplot2,而商業上的產品多使用Tableau、DOMO、 FineBI…等。
1、FineReport
FineReport 是一個報表BI軟體,是純Java編寫,集資料展示(報表)和資料錄入(表單)功能,通常是企業級的Web工具。只需要簡單拖移操作便可以設計出複雜的報表,能為各個部門製作固定報表,又能為管理層製作Dashboard來提供決策分析。
- 優點:實現複雜的表格、豐富的圖表、多樣的資料視覺化場景
- 缺點:自助分析較弱
- 評價:不只是戰情室軟體,本質是通用的報表製作和資料視覺化工具。
(如Excel小到可以存儲資料、製作圖表;大到可以製作財務報表、開發進銷存系統)
* 免費下載FineReport10.0
2、FineBI
FineBI是商業智慧BI工具,它與Tableau相似,都主張視覺化的探索性分析,有點像加強版的樞紐分析表。
- 優點:上手簡單、視覺化庫豐富
- 應用:資料報表的門戶、各業務分析的平臺
- 評價:可以做到自助式分析、圖表類型豐富、資料分析功能強大(鑽取、篩選、分組)
3、Power BI
Power BI 是一套商業分析工具(商業智慧BI工具),主要用於企業的資料分析與決策,針對分析者提出的問題,透過資料尋找答案。可連結數百個資料來源、簡化資料準備並提供立即分析,能直接在Web或行動設備上使用。
- 優點:美觀報表、功能比Excel強大、支持多種資料來源、價格便宜
- 缺點:只能作為單獨的BI工具使用,無法跟現有系統結合
* Power BI 官網的免費教學資源:
Power BI 官網的線上文檔
Power BI 官網的影片教學
Power BI 官方提供網絡研討會
* Power BI 網路影片:
跟燕秋老師學Power BI Desktop_基礎入門
【 相關課程 】資料分析師必備視覺化技能 Power BI
在這門特別為你訂製的「資料分析必備視覺化技能 Power BI 」課程中,將帶著你依照合適的動態圖表以生動的方式呈現數據,幫助作為管理決策或是分析人員的你進行決策。
4、Tableau
Tableau成立於2003年,2013年上市,是一款可視化商業智慧工具。它是資料視覺化領域的黃金準則,算是目前「最優秀的BI工具」。也是桌面系統中最簡單的商業智慧工具軟體,不僅沒有強迫使用者編寫自訂程式碼,新的控制台也可完全自訂配置。在控制台上,不僅能夠監測資訊,而且還提供完整的分析能力。
- 評價:用戶可以創建和分發互動式和可共用的儀錶板,以圖形和圖表的形式描繪資料的趨勢、變化和密度。
* Tableau的免費教學資源:
Tableau線上文檔
Tableau免費教育訓練影片
Tableau社群
Tableau精選作品集
【 相關課程 】Tableau數據視覺化分析快速上手
這門課使用淺顯的用語,非資訊出身的人員,也能迅速了解數據分析的觀念,課程設計從常用功能串聯到進階功能的組合,並輔以練習題來加強學習記憶,每個學員在學後,都可輕鬆創建Tableau各類不同視覺圖像,包括直方圖、圓餅圖、環形圖、折線圖、子彈圖、柏拉圖、熱力圖、地圖分析等,完成課程後您將能掌握大數據分析的相關知識,熟悉數據分析方法,並掌握Tableau 使用技巧成為一位善用數據解決商業問題的數據達人。
5、D3
是基於資料操作文檔的JavaScript庫。它可以將強大的視覺化元件和資料驅動的DOM操作方法完美結合。
- 優點:強大的SVG操作能力,可以將資料映射為SVG屬性,內建大量資料處理、佈局演算法和計算圖形的工具方法、有著強大的社區和demo
- 缺點:API 太底層、複用性低、學習與使用成本高
6、HighCharts
是用純 JavaScript編寫的圖表庫, 能簡單便利的在Web應用上加上交互性圖表,也是在Web上使用最廣泛的圖表,但企業使用需要購買商業授權。
- 優點:使用門檻極低、相容性好、使用廣泛、相對成熟
- 缺點:樣式較舊、圖表難以擴展、商業使用要買版權
7、ECharts
企業級圖表,開源來自百度數據視覺化團隊,是純 Javascript 的圖表庫,能流暢的運用在PC和行動設備上,相容當前絕大部分流覽器。
- 優點:豐富的圖表、覆蓋主流常規的統計圖表、配置項驅動、三級個性化圖表樣式管理
- 缺點:靈活性不如 Vega等基於圖形語法的類庫、難以客製複雜關聯式圖表
8、Leaflet
是面向移動設備的互動式地圖的JavaScript 庫。測量的JS僅有大約 38 KB,它具有大多數開發人員需要的所有映射功能。
- 優點:專門針對地圖應用,mobile相容性好、API 簡潔、支援外掛程式機制
- 缺點:功能較簡單,需要具備二次開發能力
9、Vega
是一套交互圖形語法,定義資料到圖形的映射規則、常見的交互語法和常見的圖形元素,可以自由使用 Vega 語法進行組合構建出各式圖表。
- 優點:基於 JSON 語法,提供從資料到圖形的映射規則,支援常見的交互語法
- 缺點:本身有複雜的語法設計,使用和學習成本高
10、Deck.gl
是 Uber視覺化團隊基於WebGL開發的面向大數據分析的視覺化類庫。
- 優點:以 3D 地圖視覺化為主,內置地理資訊視覺化常見場景,支援大規模資料的視覺化
- 缺點:需要具備WebGL的知識,層的擴展比較複雜
* WebGL:
是一種JavaScript API,
用於在不使用外掛程式的情況下在任何相容的網頁瀏覽器中呈現互動式2D和3D圖形。
完全整合到瀏覽器的所有網頁標準中,
可將影像處理和效果的GPU加速使用方式當做網頁Canvas的一部分。
想成為爬蟲工程師 、資料分析師 、資料工程師 、資料分析領域專家 、人工智慧產品經理嗎?還是你的公司正需要培養此領域人才呢?
點我了解 AI資料科學家-三階段全方位學程班 👉 https://www.tibame.com/eventpage/ai_datascientist
每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。
若想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或有其他想了解的主題歡迎在下方留言讓我們知道唷!
參考資料