資料科學/人工智慧的第三階段主要工作流程為資料儲存 ,在資料分析需要的資料儲存是由資料倉儲或資料湖所建構起來。
由於資料在儲存階段是不斷變化和更新,它的即時性、完整性、一制性、準確性,都可能因為軟硬體或是環境問題而影響後期的應用。
其「資料倉儲」專為資料分析所設計,資料倉儲可包含多個資料庫。在每個資料庫中,資料被整理成資料表和資料欄。在各欄中,您可以定義資料的描述,例如整數、資料欄位或字串。導入資料時,會將資料存放在結構化的各種表格中。查詢工具使用結構描述決定要存取和分析的資料表。
Tag: